1. 主页 > 社会焦点

理论成本利润率545%!DeepSeek 知乎发文引业内震动

3月1日,DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文,首次公布模型推理系统的核心优化方案,并披露理论成本利润率高达545%,刷新了全球AI大模型领域的盈利高点,引发业内震动。

《概览》显示,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。

为了实现上述两个目标,DeepSeek使用大规模跨节点专家并行(EP)。首先EP使得批量尺寸大大增加,从而提高图形处理器(GPU)矩阵乘法的效率,提高吞吐。其次EP使得专家分散在不同的GPU上,每个GPU只需要计算很少的专家,因此更少的访存需求,从而降低延迟。

EP同时也增加了系统的复杂性。因此,《概览》就如何使用EP增大批量尺寸、如何隐藏传输的耗时、如何进行负载均衡等进行了讲解。

DeepSeek还披露了DeepSeek的理论成本和利润率等关键信息。

文章称,在北京时间2月27日12:00至2月28日12:00,DeepSeekV3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800GPU)。假定GPU租赁成本为2美元/小时,总成本约为8.71万美元/天。

如果所有tokens全部按照DeepSeekR1的定价计算,理论上一天的总收入大约56.20万美元,成本利润率为545%。

DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,也预示着AI大模型的盈利闭环已从理想照进现实。此前发布的DeepSeek-V3模型训练成本仅557.6万美元,是同类产品的1%-5%。

DeepSeek此次在知乎发布《概览》,引来近600条评论、5000多点赞。有网友称,今日发布的《概览》技术文章是“开源周彩蛋”,直接亮出了底牌。有网友称赞:“太强了,AI算力成为水电的基础是要足够便宜,Deepseek迈出了一大步”。

《概览》发布也标志着全球关注的“DeepSeek开源周”正式收官。“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 203304862@qq.com

本文链接:https://jinnalai.com/jiaodian/733442.html

联系我们

在线咨询:点击这里给我发消息

微信号:

工作日:9:30-18:30,节假日休息