目录
大模型的成本结构复杂且多样涵盖了,从开发到运维的各个环节,具体包括以下几个方面:
1、训练成本
训练成本是指从零开始训练一个大模型所需的费用,是大模型开发过程中最显著的支出之一。它主要包括硬件费用和能耗成本。
(1)硬件费用
例如:训练GPT-3(175B参数)约需10,000+张A100GPU,训练时间约34天。
公式:
训练成本=GPU数量×每小时租赁成本($)×训练小时数训练成本=GPU数量×每小时租赁成本($)×训练小时数
依据:
单张A100GPU云租赁成本约为$1~2/小时。
按1万张GPU运行34天计算:10,000×1.5×(34×24)≈$122.4万(2)能耗成本
依据:单张A100GPU功耗约300W,