如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-22 11:35:17
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-24 23:40:15***拍大尺度片子时摄影师不会看光吗?
- 2025-06-24 23:15:16能不能通过养殖方法,把淡水鱼身上***除掉?然后再售卖做刺身,超级爱吃刺身,很害怕寄身虫?
- 2025-06-24 23:10:16你被哪个后来知道很sb的BUG困扰过一周以上吗?
- 2025-06-24 23:35:16发现孩子走丢的那一刻,你是什么心情?
- 2025-06-24 23:10:16你会从mac转向Windows吗?
- 2025-06-24 23:20:15前端如何设计网页?
- 2025-06-24 23:40:15为什么大家不再提星链了(包括外网)?
- 2025-06-24 23:00:16慢跑 5 公里用 40 分钟是不是很丢人?
- 2025-06-24 23:15:16经常跑马拉松是慢性自杀吗?
- 2025-06-24 23:40:15为什么提傅首尔面相而忽略一件事情本质呢?
推荐产品
-
为什么 Golang 不适合开发桌面系统?
goroutine 这个号称最适合开发网络应用的东西用在客户 -
有一个***约你出去,你会去吗?
就我楼上,一个单亲妈妈,带两个孩子。 也就电梯里打过几次招呼 -
面试中被嘲笑Token放在redis里,该如何应对这种情况呢?
token放在redis里只是一种很正常的方案。 在有多个后 -
为什么大家不再提星链了(包括外网)?
多简单,因为中国输了,而且短期没有任何机会赶上。 这玩意儿
最新资讯