继2月、5月杨植麟和梁文锋两次论文“撞车”后,本周,杨植麟和闫俊杰首次在大模型赛道中“撞车”,目标则是梁文锋的DeepSeek。
近日,月之暗面发布首款面向软件工程任务的开源代码大模型Kimi-Dev-72B,基于720亿参数的Qwen2.5-72B模型训练,采用大规模强化学习方式优化,在SWE-benchVerified基准上实现60.4%准确率,超越DeepSeek等模型。而且,6月20日晚,月之暗面发布首个Agent,宣布小范围内测Kimi-Researcher(深度研究)。
与此同时,“大模型六小虎”(智谱、百川、零一、MiniMax、月之暗面、阶跃星辰)里面的另一家公司MiniMax进入新品周,连续发布五个产品:RL训练成本仅53万美元(约380万元)、性能比肩DeepSeek的开源推理模型MiniMax-M1,成为上下文最长的推理模型;性能仅次于字节Seedance1.0、超越Veo3的Hailuo02(0616)视频模型;通用智能体产品MiniMaxAgent;海螺视频Agent;以及今天发布的MiniMaxAudio更新版本。
值得注意的是,“大模型六小虎”也在争夺第一股。继智谱之后,据彭博,稀宇科技(MiniMax)正考虑赴港首次公开募股(IPO),估值约30亿美元,目标是在今年IPO,已经与投行进行沟通。另据字母榜,六小虎里已经有五家在筹备上市。
显然,随着DeepSeek跻身AI领域“顶流”之列,从月之暗面CEO杨植麟、闫俊杰,到其他“大模型六小虎”企业创业者,都仿佛被DeepSeek、字节、阿里等多座“大山”压得步履维艰。他们借助技术产品发声,字里行间无不透露着“自己不希望被遗忘”。
MiniMax创始人兼CEO闫俊杰近期发文表示,“第一次感觉到大山不是不能翻越。”
然而,多名业内专家告诉笔者,基座级大模型的争夺,关键还是参数的大小,而目前的情况是,这六家公司都缺少强大的计算能力,也没有足够的专业技术人员,不少高管都已经离开了字节跳动、阿里这样的大公司。因此,钱不够、卡不够、数据不够、商业化艰难,这种情况下“大模型六小虎”不得不分化找寻融资出路,面临多重挑战。
IDC分析师称,2023年-2028年中国生成式AI软件市场规模大约只有48.9亿元,包含企业级AI平台、应用规模,相比算力和基础设施规模简直不值一提。“现在消费级AI应用培育出来市场规模并不大。”
针尖对麦芒,MiniMax和kimi都对标DeepSeek
“DeepSeek之前,人们认为中国的AI模型落后了好几年,而我们意识到它们实际上只落后了几个月。”美国白宫加密货币和AI事务负责人DavidSacks近期表示,在AI大模型方向,中国落后美国大概是3-6个月。
事实上,自年初开始,DeepSeek(深度求索)以低成本、高性能的开源模型迅速崛起,导致“大模型六小虎”的融资面临挑战,这六家企业正经历着前所未有的行业洗牌。从商业模式的重构到资本寒冬的侵袭,从人才流失的阵痛到技术路线的迷茫,“六小虎”的生存图景在DeepSeek的冲击下呈现出复杂而严峻的局面。
“市面上90%的AI服务,都是‘伪AI’。”梅花创投创始合伙人吴世春近期表示,很多AI技术缺乏护城河,AI技术公司若无法构建底层技术壁垒,终将面临被替代风险,行业需警惕伪创新泡沫。每次大模型升级都会对其造成冲击,所有套壳行为都只是短期套利。
“大模型六小虎”公司早期普遍以“通用大模型+行业解决方案”为核心商业模式,试图通过技术授权、定制化项目和云服务获得收入,包括API服务、内嵌广告业务、订阅服务、定制化开发、应用合作分成等。
而如今,在DeepSeek热潮刺激之下,对于通用人工智能(AGI)的目标更为明确。
清华大学教授、智谱AI创始人唐杰近期分享了上述这张图,通过多种多类的多模态AI大模型,可以直接对标人类的大脑、小脑,形成让机器像人一样的思考能力。
而这次,MiniMax和Kimi月之暗面迎来了首次在大模型赛道“撞车”,几乎同一时间发布新产品。
其中,MiniMax连续五天发布新品,推出了推理模型、视频模型、语音模型、Agent智能体等技术,几乎瞄准的都是智谱现有的技术产品。
而MiniMax发布的MiniMax-M1系列模型引发广泛关注,其在处理百万级Token的长文本上实现了重大突破,并且其RL(强化训练)成本下降一个量级,成本仅53万美元(约380万元),推理效率则数倍于竞争对手。
据论文显示,在工具使用场景(TAU-bench)中MiniMax-M1-40k同样领跑所有开源权重模型,超过Gemini-2.5Pro;代码能力(SWE-bench)方面,M1-40k和M1-80k版本分别取得了55.6%和56.0%的优异成绩,显著超越其他所有开源模型,稳居第一梯队;长文本(MRCR)方面,依托百万级上下文窗口,M1系列在此项任务中不仅全面超越了所有开源对手,甚至击败了OpenAI的GPT-4o和Anthropic的Claude3Opus,在全球范围内仅以微弱差距落后于谷歌的Gemini2.5Pro,位列全球第二。
目前,MiniMax-M1已宣布开源。价格方面,针对0-32kToken处理层面,输入0.8元/百万Token,输出8元/百万Token;32k-128kToken层面,输入1.2元/百万Token,输出16元/百万Token;128k-1MToken层面,输入2.4元/百万Token,输出24元/百万Token。
相比文本模型,虽然MiniMax图生视频模型海螺Hailuo-02效果更好,但会员价格更昂贵,一年订阅最高1499.99美元(约为人民币10769元),每月12000个积分(约合生成480个视频)、10秒视频生成,相比爱诗、生数Vidu(一年6710元)、快手可灵(钻石5594元)等同行C端收费模式贵很多,更不用说B端的预付费模式了。
从MiniMax整体来看,一方面在于拓展产品矩阵,目前海螺AI与新上线的MiniMaxAgent均已开启订阅服务;另一方面则聚焦付费意愿更强的海外市场,近期推出的模型及产品均同步在海外进行上线。
很显然,结合与MiniMax即将IPO消息来看,MiniMax或许“烧不动”投资人的钱,打算用更大的利润和收入满足IPO上市要求,从而让MIniMax尽快实现IPO上市。
闫俊杰曾向笔者表示,当国内大模型“价格战”发生后,大部分公司认为大模型很贵,之后很多人认为大模型很便宜,可以放心地使用。最终非常惊人地发现,有许多传统企业非常愿意使用大模型,他们觉得反正成本低,出错了之后也不要紧,多调用一次就好了。客观地来说,这极大提高了模型调用量,从而推动模型做得更好,至少目前在非英语语种上,国内大模型水平已与GPT不相上下。因此,从乐观角度看,国内大模型的使用量确实在显著地增长,并且中国AI大模型在海外确实越来越具有竞争力。
“竞争不可避免,既然不能避免,就要努力做到最好。”闫俊杰称,“在同等计算GPU条件下,尽可能训练更多的轮次、更大数据,做一些科研上的比较有挑战的事,做别人没有做过的事情。经过几次科研的突破,其实能以比较有限的资源,做出一个在国际上第一梯队多模态的表现,这个我们目前还是比较骄傲的。”
相比MiniMax,月之暗面不再专门做文生视频、图生视频模型,而是专注于LLM理解和思考,直接瞄准DeepSeek。
6月17日,月之暗面发布最新开源编码模型Kimi-Dev-72B,在SWE-benchVerified上取得了60.4%的性能提升,超越DeepSeek,创下开源模型SOTA成绩。
随后,月之暗面更进一步,6月20日晚发布其首个Agent——Kimi-Researcher,采用异步执行方式,用更多时间逐步推理、检索和撰写内容。月之暗面表示,模型即Agent,Kimi-Researcher是基于端到端自主强化学习技术训练的新一代Agent模型,也是一个专为深度研究任务而生的Agent产品。
性能方面,在红杉中国发布的xbench基准测试,Kimi-Researcher在DeepSearch任务中取得69%的平均通过率,领先该榜DeepSeek等其他模型。而在Humanity’sLastExam(HLE)中,Kimi-Researcher性能超过OpenAIDeepResearch(26.6%)、Gemini2.5Pro(21.6%),和Gemini-Pro的DeepResearchAgent(26.9%)打平。
“我们也将逐步开源Kimi-Researcher基础预训练模型、以及强化学习后的模型,希望与大家一起推动Agent强化学习方向的探索。”月之暗面表示。
据笔者了解,月之暗面也在考虑IPO上市或其他资本化事宜。早前有报道指出,杨植麟已在内部定下通用AI模型目标,减少投流而把更多资源转向AI模型技术能力迭代。
很显然,大家都想对标DeepSeek。笔者了解到,近期智谱也将推出新技术产品,依然瞄准DeepSeek。
六小虎抢大模型第一股,今年上半年A股IPO融资增长14%
2023年上半年,百川智能、阶跃星辰、零一万物和月之暗面成立,DeepSeek也是这一年成立。智谱和MiniMax要更早些,分别是在2019年和2021年,如今估值都高达200亿元左右。
从时间来看,“大模型六小虎”已经可以开始筹备IPO了。因此当前,六家公司都在追逐IPO上市之路。
今年4月14日,智谱正式提交上市辅导备案,由中金公司担任辅导机构。成为六小虎中首家启动IPO进程的企业。
如今,MiniMax也在筹划赴港IPO。
然而,时间先后并非IPO的最大优势,智谱未必有先发优势。据智谱公布的备案计划,上市辅导分三阶段推进:4月完成摸底调查与方案制定;5月至7月聚焦规范整改与持续尽调;8月至10月进入冲刺期,筹备上市申请文件。也就是筹备IPO,再加上审批、路演等等必要程序,距离招股书还有半年多时间,离IPO上市执照还有半年到一、两年的时间。
2025陆家嘴论坛上,中国证监会宣布计划在上海以科技股为主的科创板设立新板块,以容纳尚未盈利的成长型企业。其中不仅重点提到AI企业,更提及将重启未盈利企业适用科创板第五套标准上市,近期兆芯、PPIO等多家AI公司都是在这样一个大环境下启动IPO。
有多家企业负责人告诉笔者,对于科创板第五套标准上市正在仔细研读,这对于很多AI、半导体、机器人等领域处于亏损的科技企业来说是一件利好。
智谱今年3月曾向笔者透露,2024年以来,智谱的ARR商业化收入取得了100%以上的增长。
“在B端,在API价格大幅普惠的情况下,智谱MaaS开放平台API年收入同比增长超过30倍;在C端,2024年三季度上线付费功能以来,‘智谱清言’预计年收入超过千万元。目前,智谱清言拥有超过2500万用户。”智谱称。
不过,“大模型六小虎”陆续出现高管离职情况,对于企业发展和市场观感等极为不利,有可能成为上市阻碍。
智谱AI在2025年上半年有4名高管离职,包括首席运营官张帆、智谱应用AI与合作副总裁李惠子等,但公司表示这些变动不会影响整体融资和业务进展。同时,公司引入了Midjourney前高管,强化C端市场布局。
MiniMax公司合伙人魏伟等商业化负责人离职,但官方表示这是B端业务进入新发展阶段的正常调整。
零一万物联合创始人谷雪梅、技术副总裁戴宗宏等核心成员离职创业,并获得创新工场投资支持。
零一万物创始人兼CEO李开复今年3月表示,DeepSeek掀起的行业变革彻底颠覆了AI行业发展模式,可能让OpenAI创始人辗转难眠。他预测,中国市场最终可能只剩下DeepSeek、阿里巴巴和字节跳动三家主要的AI模型公司,其中DeepSeek目前势头最强。
然而,从大环境来看,当前资本市场环境极佳,是AI公司上市的好时机。
德勤中国资本市场服务部发布的最新报告显示,2025年上半年(数据预估至2025年6月30日),A股市场将有50只新股上市,合计融资371亿元。相较去年上半年的44只新股合计融资325亿元,今年上半年A股的IPO数量、融资额同比均上升14%。
其中,19只新股将于上海证券交易所上市融资202亿元人民币,同时深圳证券交易所录得26只新股融资150亿元人民币。北京证券交易所将有5只新股融资19亿元人民币。创业板以新股数量成为最活跃的市场板块,而上海主板则以融资金额带领其他的市场板块。
港股方面,德勤报告显示,今年上半年,港股有40只新股融资1021亿港元,与去年同期的30只新股融资132亿港元相比,代表新股上市数量增加33%,融资总额攀升673%。接近四分之三的2025年上半年的融资额来自4只超大型A+H新股及1只H股上市。
仅在6月(截至2025年6月22日),港交所、上交所官网就有超过60家企业提交IPO上市招股书。
展望2025年下半年,对于港股,目前有超过170宗正在处理的上市申请个案,包括超过5家公司每家或会融资最少10亿美元,德勤中国资本市场服务部预计2025年全年港股新股市场可从80只新股融资2000亿港元。除了年内或会录得25只A+H新股外,大部分的上市项目将会来自科技、消费业等。
德勤中国资本市场服务部上市业务华北及华西区主管合伙人任绍文解释指出,上半年港交所凭借多只超大型新股荣升第一。鼓励内地龙头企业来港上市、简化A股上市公司的申请上市程序,及更理想的估值、更佳的市场流动性及资金承接能力均一一推动新股市场的动力。
任绍文指出,只要未出现重大负面的地缘政治或宏观经济干扰,其对港股在2025年具备条件争取全球IPO市场领先地位持审慎乐观态度。
“越来越多A股上市公司,包括来自全国中小企业股份转让系统(即新三板),正积极利用香港这个国际融资平台,拓展全球资本、提升品牌影响力,实现‘出海’的战略。同时,随着‘科企专线’等政策新措施落地,将有更多生物科技及特专科技企业来港上市,为市场注入更多增长动能。港股上市制度持续优化,吸引了大量新经济企业及潜在上市申请人,资本市场的深度与竞争力不断提升,进一步巩固其作为全球领先上市平台的地位。”任绍文称。
A股方面,德勤预计,在目前新环境下,随着证监会推出进一步深化科创板改革的“1+6”政策措施,以及在创业板正式启用第三套标准支持优质未盈利创新企业上市等政策的实施,接下来A股市场有望逐步活跃,尤其是高科技企业的上市。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 203304862@qq.com
本文链接:https://jinnalai.com/jiaodian/757280.html