证券数据中心人工智能 GPU 人工智能算法 ChatGPT 大语言模型证券AI大模型

引入大模型后，现有AI平台应该如何优化提升算力？

引入大模型后，AI平台应该如何优化提升算力，以及AI平台架构对接数据中心现有架构对接需要有哪些改造？如何设置合理的GPU等资源用于大模型推理，如果控制资源使用避免潜在问题发生？部署大模型对AI平台建设配置等有什么要求引入大模型后期该如何调优，在金融行业应用中大模型的准确...显示全部

关注2

参与6

返回daliu的回答

daliu系统架构师某金融机构

引入大模型之后，AI平台可以通过增加GPU数量、升级硬件设备包括存储、网络配置、优化算法模型、优化计算资源调度算法等方式提升算力。
在设置合理的GPU等资源用于大模型推理时，需要注意以下几点：
1、合理规划GPU资源：根据数据中心的实际情况，合理规划GPU资源，避免资源浪费和性能瓶颈。
2、监控GPU使用情况：为了控制GPU资源的使用，需要监控GPU使用情况，及时发现和解决潜在问题。
3、优化GPU使用：根据大模型的特点和数据特征，优化GPU使用，如避免过度训练、调整模型参数等，以提高模型的准确率和效果。

部署大模型对AI平台配置要求如下：
1、高性能计算机：部署大模型需要使用高性能计算机，推荐裸金属服务器或高性能服务器。
2、大容量高性能存储：为了存储大模型的数据和模型，需要使用大容量高性能存储设备，如SSD等。
3、高性能网络：使用高速网络设备，配置高性能网卡，使用高性能网络协议等

对于大模型的监控，可以参考以下监控指标：

模型准确率：监控模型的准确率、召回率等指标
计算效率：监控模型的计算效率、GPU的利用率等指标
数据集大小：监控数据集的大小、数据分布等指标
训练时间：监控训练时间、模型参数更新频率等指标
资源消耗：监控资源消耗、计算和存储消耗等指标

银行 · 2023-04-25

查看赞同的人

引入大模型后，现有AI平台应该如何优化提升算力？

返回daliu的回答

回答者

daliu 最近回答过的问题

回答状态