似乎就在一夜之间,来自中国的AI公司DeepSeek(深度求索)在大洋彼岸全面“破圈”,从高高在上的美股巨头,到使用AI工具的普通用户都被DeepSeek最新发布的R1模型深深震撼。
当地时间27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,在美区下载榜上超越了ChatGPT。Meta、OpenAI等科技巨头员工发帖称,公司内部已开启了“恐慌模式”,紧急制定对策。德国经济学家豪尔格·查皮兹表示,DeepSeek将成为“美国股市的最大威胁”。美国“投资百科”网站称,特朗普才刚刚喊出5000亿美元的“星际之门”计划,就被中国一个仅仅训练了2个月的AI模型打击了信心。
当地时间27日,阿斯麦、英伟达、博通盘前跌超10%,台积电跌超9%。
据报道,DeepSeek创始人梁文锋1985年出生于广东省湛江市吴川市,根据领英等网站公开可查的资料,DeepSeek团队成员约超过一半为95后,90后占比超过75%。梁文锋曾表示,公司员工“都是一些Top高校的应届毕业生、没毕业的博四、博五实习生,还有一些毕业才几年的年轻人”。DeepSeek内部的团队氛围也较为宽松,梁文锋曾表示团队中每一个成员可以调用的资源都“没有上限”,并且管理制度上非常推崇扁平化。
“低成本训练”震撼美国巨头
专家:对美股泡沫冲击大
去年12月26日,DeepSeek发布的V3模型就初露锋芒,以大约OpenAI二十分之一的训练成本获得了比肩世界顶级性能的大模型。紧接着在今年1月20日,DeepSeek再度发布R1模型。美国加州的ScaleAI公司致力于测评各种AI模型的实际性能,其创始人亚历山大·王在接受采访时表示:“老实说,我觉得DeepSeek在很多项指标上都达到了美国最先进模型的水平”。
除了性能优异,DeepSeek作为一个开源模型,对终端用户始终免费开放,而它对于开发者调用API的收费定价水平几乎为OpenAI的百分之一。此前DeepSeek曾公开回应“价格战”的指控,表示在这样的定价之下自己仍有合理的利润结构。低廉的价格来源于该公司在软件算法层面的创新,改变了美国科技巨头们囤积GPU显卡“堆算力”的惯性思维。据悉R1的训练只调用了2000余块显卡,为期53天,总的训练成本仅为558万美元,不到其他世界顶级大模型一次训练成本的十分之一。
这样的极致性价比,让在AI热潮下被炒高了两年的美国科技股感到巨大的“寒意”。豪尔格·查皮兹25日写道:“这家中国公司以极端低廉的成本,在缺少最顶尖芯片供应的情况下打造出一个震动世界的模型,这是对美股泡沫构成的最大威胁。”美国经济学家亚德尼表示,“DeepSeek的成功可能会给美股财报季带来压力,尤其是在谷歌、Meta和微软等公司加大AI资本投入的情况下。尤其是微软,它是OpenAI的最大投资者。”
在DeepSeek热潮的带动下,英伟达股价在当地时间26日下跌3.12%。27日盘前,英伟达股价重挫超10%,带动纳指期货下跌4%。英伟达下一次财报公布预计在2月26日。27日,A股市场迎来春节前最后一个交易日,一些“算力概念股”也因DeepSeek的成功受到影响。不过和DeepSeek公司关联较深的浙江东方、每日互动等个股出现一字涨停。
此外有Meta员工在论坛匿名发帖表示,公司内部针对DeepSeek崛起的威胁感到高度紧张。“毕竟人家模型的训练成本还不如Meta一位高管的年薪,而我们这里有几十位这样的高管,想想这些人怎样才能向上级交差吧。”
创始人梁文锋:
85后“老股民”从量化投资起家
▲梁文锋(右)参加工作座谈会
据湛江发布,DeepSeek创始人梁文锋是吴川市覃巴镇米历岭村人,父母都是小学语文老师。“85后”的梁文锋从小就是“学霸”,在数学方面天赋突出。同学们反映,梁文锋并非“书呆子”类型,而是很有独立思考的精神。梁文锋本科和硕士都就读于浙江大学,2008年,研究生毕业的梁文锋并没有走上“码农”的道路。当时推崇“量化投资之父”西蒙斯的他和朋友一起在出租屋内刻苦钻研,想要找到对股票价格建模的方法。
2010年,沪深股指期货推出,这给了梁文锋充分发挥计算机建模天赋的机会。很快他的自营资金盘就达到了5亿元的水平。2015年,梁文锋与校友一起共同创立幻方量化,在A股市场系统性地进行量化交易。2021年,幻方量化的资产管理规模达到千亿水平,被誉为国内四大顶级量化私募之一。
幻方量化的成功离不开人工智能的深度融合,梁文锋很早就产生了用AI自动制定量化交易策略的想法,并坚持不懈地付诸实践。2020年,英伟达发布了A100芯片,这是英伟达下一代旗舰作品,而幻方量化成为亚太地区第一批拿到货的客户。幻方量化多年来不仅储备了大量的尖端芯片,而且在软件算法层面不断推陈出新,这给梁文锋在AI领域的创业奠定了扎实的基础,2023年7月他创立了DeepSeek(全称“杭州深度求索人工智能基础技术研究有限公司”)。
DeepSeek团队:
90后、95后为主,喜欢“高潜力年轻人”
据报道,DeepSeek的员工规模不到140人,是OpenAI的十分之一左右。据领英网站检索样本发现,DeepSeek员工85%以上拥有硕士学位,40%以上有博士学位。团队成员平均年龄约为28岁,90后占比超75%,95后(1995年后出生)员工占比50%以上。该公司成员大多毕业于北大、清华、中科大等国内顶尖院校,也有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校。同时DeepSeek的员工中也有相当一部分具有交叉学科背景。
▲幻方量化旗下大模型公司DeepSeek
和动辄上千人的“大厂”AI开发团队相比,DeepSeek百余人的规模显得相当精炼,并且在选人标准上两者也大有不同:互联网公司一般看重成熟的经验,最好有在核心项目成功过的经历,而DeepSeek则喜欢“高潜力年轻人”。以该公司选择的“稀疏训练”技术路径为例,刚毕业的博士生由于在学校里接触过相关前沿课题,对这一技术路径更加熟悉,而“业界老鸟”则不一定对最新技术能保持高度敏感。
据“智能涌现”,一名曾与DeepSeek有过合作的猎头表示,DeepSeek非常偏爱没有工作经验的年轻人,而且指明不要资深人士,“工作经验在3~5年已经是最多的了,工作超8年的基本就pass了”。
梁文锋曾在采访中表示,留住年轻人才的方法主要是“高薪”和“算力管够”两条路。业内人士表示,DeepSeek的薪资水平能够对标业内任何顶尖机构,而且人才如果在字节跳动等取得offer,DeepSeek还会加码竞争。DeepSeek开出的应届工程师薪酬已经等同于业界同等岗位的“总监/经理”的薪酬了。
此外梁文锋非常推崇“极客文化”,在公司内部推行扁平化管理,并且鼓励员工个人发挥潜能进行学习和创新。DeepSeek也不会采用互联网巨头常用的“赛马”机制,减少团队内耗。在算力资源的调配上,梁文锋对每个人都不设上限,只要提出有潜力的思路,他都会给员工调拨足够的资源进行尝试研究。据悉产生R1模型的技术思路就是一名年轻员工“突发奇想”提出的点子,梁文锋为他搭配了一个团队,“花了几个月时间才跑通(技术路线)”。事实证明,DeepSeek这种“轻经验、重潜力”的用人思路,为中国AI界迎来了一次划时代的创新发展。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 203304862@qq.com
本文链接:https://jinnalai.com/jiaodian/726269.html