IT之家7月31日消息,阿里通义千问今日宣布推出全新推理模型Qwen3-30B-A3B-Thinking-2507。相较于4月29日开源的Qwen3-30-A3B模型,新模型在推理能力、通用能力及上下文长度上有了显著提升:
新模型在聚焦数学能力的AIME25评测中斩获85.0的高分,在代码能力测试LiveCodeBenchv6中得分66.0,两项核心推理能力均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking);新模型的知识水平(GPQA、MMLU-Pro)也较上一版本进步显著。
在写作(WritingBench)、Agent能力(BFCL-v3)、多轮对话和多语言指令遵循(MultiIF)等通用能力评测中,Qwen3-30B-A3B-Thinking-2507均超越Gemini2.5-Flash(thinking)、Qwen3-235B-A22B(thinking)。
更长的上下文理解,原生支持256Ktokens,可扩展至1Mtokens。
此外,新模型的思考长度(thinkinglength)也增加了,官方推荐在高度复杂的推理任务中设置更长的思考预算,以充分发挥它的潜力。
官方透露,目前Qwen3-30B-A3B-Thinking-2507已在魔搭社区、HuggingFace上开源,其轻量体积可轻松实现消费级硬件的本地部署;同时,其也在QwenChat上同步上线了新模型。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 203304862@qq.com
本文链接:https://jinnalai.com/jiaodian/765824.html