如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?
- 发表时间:2025-06-21 04:35:15
- 来源:
当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。
你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。
我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。
这是第五题的原题,正确答案是A. - 1/2。
这是之前的第三方的测试结果,6个模型…。
推荐资讯
- 2025-06-19 22:00:16养乌龟如何降低换水频率?
- 2025-06-19 22:50:15我是新手想养鱼,预算不超过200。有什么好的建议或者禁忌吗。?
- 2025-06-19 22:35:16买到烂尾楼到底该有多绝望?
- 2025-06-19 22:00:16西方人是怎么发现地球是圆的的?
- 2025-06-19 22:50:15如何评价前端框架 Solid?
- 2025-06-19 22:05:16如何看待“计算机民科“的网站51soez已关站维护一周?
- 2025-06-19 21:35:16南京六大高中是哪六大?
- 2025-06-19 21:55:16golang为什么要内置map?
- 2025-06-19 22:15:16怎么提高自己的系统设计和架构理论水平?
- 2025-06-19 22:50:15如何基于Docker进行开发?
推荐产品
-
老板说我设计了一周的海报还是不行,我到底该怎么学啊?
如果你老板要求不高的话,还可以抢救一下,但是也得学一段时间 -
张伟丽可以打败什么级别的普通男性?
拍个照给你们看,这是我公司隔壁的拳馆。 里面有个泰拳女 -
目前最具性价比的全栈路线是啥?
有一个网站可以查任意一个网站的技术栈。 w***alyze -
央企的信创,是否有必要把 spring 替换成国产的 solon ?
2021 年我亲自去现场部署过信创环境,某某档案系统。 J*
最新资讯