如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-25 03:50:14
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-25 15:50:19有一张巨强的显卡是什么体验?
- 2025-06-25 16:20:19Rust开发Web后端效率如何?
- 2025-06-25 15:55:18修仙文明可能以怎样的方式碾压星际文明?
- 2025-06-25 16:25:18rust有什么适合萌新练手的项目吗?
- 2025-06-25 17:15:19为什么很难聘到前端工程师?
- 2025-06-25 16:05:18有哪些新生代没见过或者无法理解的 Windows 95/98 时代的事情?
- 2025-06-25 16:20:19你怎么看待剪映收费过高问题?
- 2025-06-25 16:20:19买到烂尾楼到底该有多绝望?
- 2025-06-25 16:00:19面相长的凶是什么体验?
- 2025-06-25 17:00:17曾经的班花,现在还多少人惦记?
推荐产品
-
Flutter 为什么没有一款好用的UI框架?
有, 而且很高质量! (辛苦整理全是收藏,没有关注点赞和评论 -
几年前吹的神乎其神的朱姆沃尔特舰为什么现在销声匿迹了?
因为主母典型的失败了。 朱姆沃尔特驱逐舰是美海军在上个世纪 -
如何看待罗永浩回忆被华为公司余承东野蛮人式挖人?
公司旗下有个项目,在一个很细分的领域做到了全国第一,刚好和车 -
上知乎的穿越者可以透露一点未来的事吗?
看到天涯贴中国布局了十年,到今天西方才看懂,已经设有意义了。
最新资讯