当前位置: 首页 >
如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 人气:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-24为什么 macOS 上国产软件不流氓?
- 2025-06-24Golang vs Rust vs Dlang 哪个更有前途,哪位大牛这 3 门语言都用过?
- 2025-06-24有人说24GB和48GB内存容量是新一代电脑平台最均衡的方案,真的是这样吗?电脑内存应该如何选?
- 2025-06-24为何雷军天天健身,却无健身痕迹?
- 2025-06-24你们的相册里是否有一张充满遗憾的照片?
- 2025-06-24如何评价 Vue.js 纪录片?
- 2025-06-24软路由怎么没有人玩了?
- 2025-06-242025年了 Rust前景如何?
- 2025-06-24显示器选32还是27,2k还是4k?
- 2025-06-24有哪些小众的开源项目养活了一大批人?
- 2025-06-24Rust 使用 Result 的错误处理方式与 Golang 使用 error 的方式有什么本质区别?
- 2025-06-24为什么tokio能成为rust异步标准?
- 2025-06-24大量消息在 MQ 里长时间积压,该如何解决?
- 2025-06-24Flutter 为什么没有一款好用的UI框架?
- 2025-06-24为什么面向对象编程这么困难?
- 2025-06-24如果带 ipad 到教室或者图书馆,上厕所时候会不会被偷?
推荐产品
-
周鸿祎为什么说他这辈子最鄙视李彦宏?
我今天专门登知乎,来说说360搜索。 我爸,接近60岁,因 -
腰肌劳损怎嘛治啊?
腰部问题的人十个大概都有七个有,只是轻重度程度不一样。 什 -
印巴大战,背后大国为何都不发声?
美国已经表态了,只是你装作看不懂而已。 当美国宣布锁了F1 -
做引体向上可能会诱发腰肌劳损吗?
会的,对于急性期,或者有腰肌劳损的人,又有引体向上的能力。
最新资讯