鞭牛士报道,12月20日消息,据外电报道,谷歌发布了所谓的新型推理人工智能模型——但它处于实验阶段,从我们的简短测试来看,它肯定还有改进空间。
新模型名为Gemini2.0FlashThinkingExperimental(名字有点拗口),可在谷歌的AI原型平台AIStudio中使用。模型卡将其描述为最适合多模态理解、推理和编码,能够推理编程、数学和物理等领域最复杂的问题。
在X上的一篇帖子中,AIStudio产品负责人LoganKilpatrick称Gemini2.0FlashThinkingExperimental是谷歌推理之旅的第一步。
谷歌人工智能研究部门GoogleDeepMind的首席科学家JeffDean也在自己的帖子中表示,Gemini2.0FlashThinkingExperimental经过训练,可以使用思维来强化其推理能力。
「当我们增加推理时间计算时,我们看到了有希望的结果。」迪恩说,他指的是在考虑问题时运行模型所使用的计算量。
Gemini2.0FlashThinkingExperimental建立在谷歌最近发布的Gemini2.0Flash模型之上,其设计与OpenAI的o1和其他所谓的推理模型类似。与大多数人工智能不同,推理模型可以有效地进行自我事实核查,这有助于它们避免一些通常会绊倒人工智能模型的陷阱。
缺点是,推理模型通常需要更长的时间(通常需要几秒到几分钟)才能得出解决方案。
给出提示后,Gemini2.0闪电思维实验会暂停一下再做出反应,考虑一系列相关提示,并在此过程中解释其推理。一段时间后,该模型会总结出它认为最准确的答案。
事情本该如此。当我问Gemini2.0FlashThinkingExperimental单词strawberry中有多少个R时,它回答两个。
在o1发布后,竞争对手人工智能实验室(不仅仅是谷歌)纷纷推出了大量推理模型。11月初,由量化交易员资助的人工智能研究公司DeepSeek发布了其首个推理模型DeepSeek-R1的预览版。同月,阿里巴巴的Qwen团队公布了其声称的首个o1公开挑战者。
彭博社10月份报道称,谷歌有多个团队正在开发推理模型。TheInformation随后在11月份的报道中透露,该公司至少有200名研究人员专注于这项技术。
是什么打开了推理模型的闸门?首先,就是寻找改进生成式人工智能的新方法。正如媒体最近报道的那样,用于扩展模型的强力技术不再能产生曾经有过的改进效果。
并非所有人都相信推理模型是最佳的发展方向。首先,它们往往价格昂贵,因为运行它们需要大量的计算能力。尽管到目前为止,它们在基准测试中表现良好,但尚不清楚推理模型是否能保持这种进步速度。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 203304862@qq.com
本文链接:https://jinnalai.com/jiaodian/717236.html