1. 主页 > 社会焦点

独家实拍!kimi助手判数学题翻车,漏洞百出逻辑乱,月之暗面摆烂?

我被「kimi智能助手」一阵猛如虎的操作彻底整蒙圈了!

事情是这样的,前两天孩子放学做完数学题,密密麻麻的100道数学题让我检查有没有错的。

如果手动一个个判的话,倒也不是什么难事,就是多少有些费时费力。

想着AI进化的这么厉害了,就计划用AI来判一下得了。

其实有很多AI工具可以选择,我也随意翻牌子,打开了kimi智能助手来试一下。按说宣传的天花乱坠的,时不时的就碾压chatgpt,claude什么的,算点小学数学题不是手到擒来嘛。

好家伙,不用不知道,一用真的吓一跳。本来很简单的一个事,结果让kimi越算越离谱,各种翻车和漏洞百出。

按照步骤,拍照上传试题,输入提示词:帮我判一下这些题。然后发送,坐等结果。

速度还算比较给力,比较快的给出了答案。但是,上来就来了个「以下是我找到的错误」。好吧,那有错咱得就改啊,那到底哪错了呢?

以第一个44➗2=22为例,明明是正确的,但在括号里的备注是,正确答案应该是22,而不是22。

这就奇了怪了,按这么个说法到底该怎么理解?那这道题到底算的是正确还是错误?

kimi智能助手,把所有的结果都是这样体现的。作为使用者,看的时候也是费劲吧啦,我是一整个蒙圈的。

当然我也不甘心,同时激发了好奇心,于是又试了一次。重新上传题目,输入提示词,等结果。

这次看着在展现形式上清爽了很多,直接对每道题通过和❌符号来显示。

但是,诡异的来了,明明一道对的题1000➗5=200,却打了❌号,并在括号中备注应为200。

后面还有两道题,同样犯了这样的错误。看着一整个大聪明的样子,其实犯了很明显的错误。

这种自相矛盾的反馈机制,就像有个偏执的数学老师在学生试卷上批注:"虽然你算对了,但正确答案应该是这个答案"。

这还没有完,我还做了其他的测试,同样的这份数学题,被kimi智能助手判的越来越玄乎。

比如上面这个,第一点,本来算对的题目,非要归为以下错误的地方,本来正确的答案,非要再括号中再说一遍正确答案应该是多少。

这还不算什么,大家看到的上图提到的错误的地方的这些题,大部分是纸质试卷中第一列没有的题目,是kimi凭空捏造出来的吗?还是只是识别了图片的试题样貌,就跟数据库中的数据做了匹配,就直接搬过来了,没有进行所谓的真实计算?大家觉得是怎么一回事?

几轮测试下来,我发现问题远比最初想象的要复杂,总结一下或许可以归结为以下三点:

数据匹配混乱:系统似乎没有真正理解题目的数学内涵,而只是机械地将图片中的数字和符号与某个预设库做模糊匹配。

逻辑判断失常:面对同样的问题,不同的输入方式可能引发截然不同的判断结果,暴露出其背后逻辑推理的不稳定性。

反馈信息混乱:无论是正确题目的额外备注,还是错误题目的“正确”标注,都让人难以理清它到底在依据什么规则判定答案。

Kimi智能助手在小学数学题批改上的“翻车”现场,不得不让人深思:我们现在所标榜的“人工智能”,到底有多少是真材实料,又有多少只是营销噱头?

本以为能省时省力,结果却被Kimi的一系列“骚操作”搞得晕头转向。从自相矛盾的答案到凭空捏造题目,Kimi的表现让我对它的智能水平产生了深深的怀疑。白瞎了你这“会推理解析,能深度思考的AI助手”的工具定位。

月之暗面公司宣传得天花乱坠,可实际体验下来,真是“给你机会你不中用”,也有“哀其不幸,怒其不争”的想法。

总之,这次体验不仅暴露了kimi智能助手的诸多不足,也再次提醒我们,在科技日新月异的今天,“智能”并非等同于完美无缺。作为用户,我们应当保持一份理性,不能被营销的光环所迷惑。

之前我们也曾分析过,自从春节deepseek横空出世以来,给像kimi智能助手这样的新晋AI公司带来了不小的压力,甚至让月之暗面公司一整个尴尬了。(《deepseek崛起,月之暗面和kimi一整个尴尬:我是谁,我在哪?》)

用户在体验过程中,原本期待Kimi能完美判定每一道数学题、精准匹配每一项数据,却频频碰到逻辑错误和自相矛盾的反馈,这种现象在DeepSeek推出后更显得尤为刺眼,给市场留下了不小的负面印象。

其次,DeepSeek不仅在产品性能上对标国际一流大模型,还通过更加开放透明的技术路线和较低的使用成本吸引了不少用户和开发者。相比之下,月之暗面的Kimi智能助手虽然依然凭借着超长上下文的技术优势占据了一席之地,但在实际应用中暴露出的问题却让部分用户开始重新审视其“智能”程度。

面对DeepSeek的崛起,原本被看好的Kimi显然需要在算法优化、数据匹配和用户交互体验等多个方面迅速迭代升级,否则很难在激烈的市场竞争中维持优势,Kimi恐将在市场中逐渐边缘化。

如果AI技术最终“落地”的产品,连最基本的小学数学题都无法“智能”批改,那么再“宏大”的“技术愿景”,也只能是“空中楼阁”。

当然我们也不能只通过这一次数学题计算的翻车,就否认kimi智能助手强大AI能力,毕竟曾作为明星级别的AI创业公司,拥有豪华的创业团队,吸金无数风光无限。通过海量广告投放,获得众多用户的青睐,ppt助手什么的也被诸多职场人士使用和讨论。至于“循环智能老股东对月之暗面提起仲裁”一事,也需要谨慎处理啊,我们先暂不赘述。

AI行业的未来将属于那些能够平衡创新与效率的公司,而月之暗面公司能否在这一波澜中找到立足之地,仍需时间检验。

总之,希望kimi智能助手和所属月之暗面公司支棱起来,长点心吧。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 203304862@qq.com

本文链接:https://jinnalai.com/jiaodian/734219.html

联系我们

在线咨询:点击这里给我发消息

微信号:

工作日:9:30-18:30,节假日休息