Bootstrap

算力100问☞第65问:大模型的成本有哪些?

目录

1、训练成本

2、推理成本

3、数据成本

4、人力成本

5、维护成本

6、其他成本


大模型的成本结构复杂且多样涵盖了,从开发到运维的各个环节,具体包括以下几个方面:

1、训练成本

训练成本是指从零开始训练一个大模型所需的费用,是大模型开发过程中最显著的支出之一。它主要包括硬件费用和能耗成本。

(1)硬件费用

例如:训练GPT-3(175B参数)约需10,000+张A100GPU,训练时间约34

公式

训练成本=GPU数量×每小时租赁成本($)×训练小时数训练成本=GPU数量×每小时租赁成本($)×训练小时数

依据

单张A100GPU云租赁成本约为$1~2/小时

按1万张GPU运行34天计算:10,000×1.5×(34×24)≈$122.4万(2)能耗成本

依据:单张A100GPU功耗约300W

;