美股震撼、科技巨头恐慌,95后成群的DeepSeek如何就一夜“破圈”?

似乎就在一夜之间，来自中国的AI公司DeepSeek（深度求索）在大洋彼岸全面“破圈”，从高高在上的美股巨头，到使用AI工具的普通用户都被DeepSeek最新发布的R1模型深深震撼。

当地时间27日，DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜，在美区下载榜上超越了ChatGPT。Meta、OpenAI等科技巨头员工发帖称，公司内部已开启了“恐慌模式”，紧急制定对策。德国经济学家豪尔格·查皮兹表示，DeepSeek将成为“美国股市的最大威胁”。美国“投资百科”网站称，特朗普才刚刚喊出5000亿美元的“星际之门”计划，就被中国一个仅仅训练了2个月的AI模型打击了信心。

当地时间27日，阿斯麦、英伟达、博通盘前跌超10%，台积电跌超9%。

据报道，DeepSeek创始人梁文锋1985年出生于广东省湛江市吴川市，根据领英等网站公开可查的资料，DeepSeek团队成员约超过一半为95后，90后占比超过75%。梁文锋曾表示，公司员工“都是一些Top高校的应届毕业生、没毕业的博四、博五实习生，还有一些毕业才几年的年轻人”。DeepSeek内部的团队氛围也较为宽松，梁文锋曾表示团队中每一个成员可以调用的资源都“没有上限”，并且管理制度上非常推崇扁平化。

“低成本训练”震撼美国巨头

专家：对美股泡沫冲击大

去年12月26日，DeepSeek发布的V3模型就初露锋芒，以大约OpenAI二十分之一的训练成本获得了比肩世界顶级性能的大模型。紧接着在今年1月20日，DeepSeek再度发布R1模型。美国加州的ScaleAI公司致力于测评各种AI模型的实际性能，其创始人亚历山大·王在接受采访时表示：“老实说，我觉得DeepSeek在很多项指标上都达到了美国最先进模型的水平”。

除了性能优异，DeepSeek作为一个开源模型，对终端用户始终免费开放，而它对于开发者调用API的收费定价水平几乎为OpenAI的百分之一。此前DeepSeek曾公开回应“价格战”的指控，表示在这样的定价之下自己仍有合理的利润结构。低廉的价格来源于该公司在软件算法层面的创新，改变了美国科技巨头们囤积GPU显卡“堆算力”的惯性思维。据悉R1的训练只调用了2000余块显卡，为期53天，总的训练成本仅为558万美元，不到其他世界顶级大模型一次训练成本的十分之一。

这样的极致性价比，让在AI热潮下被炒高了两年的美国科技股感到巨大的“寒意”。豪尔格·查皮兹25日写道：“这家中国公司以极端低廉的成本，在缺少最顶尖芯片供应的情况下打造出一个震动世界的模型，这是对美股泡沫构成的最大威胁。”美国经济学家亚德尼表示，“DeepSeek的成功可能会给美股财报季带来压力，尤其是在谷歌、Meta和微软等公司加大AI资本投入的情况下。尤其是微软，它是OpenAI的最大投资者。”

在DeepSeek热潮的带动下，英伟达股价在当地时间26日下跌3.12%。27日盘前，英伟达股价重挫超10%，带动纳指期货下跌4%。英伟达下一次财报公布预计在2月26日。27日，A股市场迎来春节前最后一个交易日，一些“算力概念股”也因DeepSeek的成功受到影响。不过和DeepSeek公司关联较深的浙江东方、每日互动等个股出现一字涨停。

此外有Meta员工在论坛匿名发帖表示，公司内部针对DeepSeek崛起的威胁感到高度紧张。“毕竟人家模型的训练成本还不如Meta一位高管的年薪，而我们这里有几十位这样的高管，想想这些人怎样才能向上级交差吧。”

创始人梁文锋：

85后“老股民”从量化投资起家

▲梁文锋（右）参加工作座谈会

据湛江发布，DeepSeek创始人梁文锋是吴川市覃巴镇米历岭村人，父母都是小学语文老师。“85后”的梁文锋从小就是“学霸”，在数学方面天赋突出。同学们反映，梁文锋并非“书呆子”类型，而是很有独立思考的精神。梁文锋本科和硕士都就读于浙江大学，2008年，研究生毕业的梁文锋并没有走上“码农”的道路。当时推崇“量化投资之父”西蒙斯的他和朋友一起在出租屋内刻苦钻研，想要找到对股票价格建模的方法。

2010年，沪深股指期货推出，这给了梁文锋充分发挥计算机建模天赋的机会。很快他的自营资金盘就达到了5亿元的水平。2015年，梁文锋与校友一起共同创立幻方量化，在A股市场系统性地进行量化交易。2021年，幻方量化的资产管理规模达到千亿水平，被誉为国内四大顶级量化私募之一。

幻方量化的成功离不开人工智能的深度融合，梁文锋很早就产生了用AI自动制定量化交易策略的想法，并坚持不懈地付诸实践。2020年，英伟达发布了A100芯片，这是英伟达下一代旗舰作品，而幻方量化成为亚太地区第一批拿到货的客户。幻方量化多年来不仅储备了大量的尖端芯片，而且在软件算法层面不断推陈出新，这给梁文锋在AI领域的创业奠定了扎实的基础，2023年7月他创立了DeepSeek（全称“杭州深度求索人工智能基础技术研究有限公司”）。

DeepSeek团队：

90后、95后为主，喜欢“高潜力年轻人”

据报道，DeepSeek的员工规模不到140人，是OpenAI的十分之一左右。据领英网站检索样本发现，DeepSeek员工85%以上拥有硕士学位，40%以上有博士学位。团队成员平均年龄约为28岁，90后占比超75%，95后（1995年后出生）员工占比50%以上。该公司成员大多毕业于北大、清华、中科大等国内顶尖院校，也有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校。同时DeepSeek的员工中也有相当一部分具有交叉学科背景。

▲幻方量化旗下大模型公司DeepSeek

和动辄上千人的“大厂”AI开发团队相比，DeepSeek百余人的规模显得相当精炼，并且在选人标准上两者也大有不同：互联网公司一般看重成熟的经验，最好有在核心项目成功过的经历，而DeepSeek则喜欢“高潜力年轻人”。以该公司选择的“稀疏训练”技术路径为例，刚毕业的博士生由于在学校里接触过相关前沿课题，对这一技术路径更加熟悉，而“业界老鸟”则不一定对最新技术能保持高度敏感。

据“智能涌现”，一名曾与DeepSeek有过合作的猎头表示，DeepSeek非常偏爱没有工作经验的年轻人，而且指明不要资深人士，“工作经验在3~5年已经是最多的了，工作超8年的基本就pass了”。

梁文锋曾在采访中表示，留住年轻人才的方法主要是“高薪”和“算力管够”两条路。业内人士表示，DeepSeek的薪资水平能够对标业内任何顶尖机构，而且人才如果在字节跳动等取得offer，DeepSeek还会加码竞争。DeepSeek开出的应届工程师薪酬已经等同于业界同等岗位的“总监/经理”的薪酬了。

此外梁文锋非常推崇“极客文化”，在公司内部推行扁平化管理，并且鼓励员工个人发挥潜能进行学习和创新。DeepSeek也不会采用互联网巨头常用的“赛马”机制，减少团队内耗。在算力资源的调配上，梁文锋对每个人都不设上限，只要提出有潜力的思路，他都会给员工调拨足够的资源进行尝试研究。据悉产生R1模型的技术思路就是一名年轻员工“突发奇想”提出的点子，梁文锋为他搭配了一个团队，“花了几个月时间才跑通（技术路线）”。事实证明，DeepSeek这种“轻经验、重潜力”的用人思路，为中国AI界迎来了一次划时代的创新发展。

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 203304862@qq.com

本文链接：https://jinnalai.com/jiaodian/726269.html