网站地图官方微信:
网站首页 金州区 钢城区 莒南县 龙岸镇 夏云镇 洞措乡

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | 使用盖碗泡茶有什么技巧? |

    极富韵味的盖碗冲泡 盖碗为白瓷制作,用其泡茶,有不失味、导热...

    查看详情>>
  • | 如何评价高度公式化的《刺客信条1》让小岛秀夫感到巨大打击? |

  • | 前后楼怎么共享宽带? |

  • | 两个问题:女足工资为什么比男足低?如果中国女足和中国男足打一场谁会赢? |

  • | 妈妈和儿子需要避嫌吗? |

  • | 为什么烤包子难出新疆? |

  • | 你怎么评价日本某个前空姐说:“如果我在经济舱,年薪2000万日元以下的乘客没有资格给我递名片”? |

  • | 深圳房价能跌到什么位置? |

  • | 你生活中做过最自律的一件事是什么? |

  • | 为什么都说 Finder 难用? |

  • | 你卡过最厉害的bug是什么? |

  • 曾经就是全国一张卷啊 曾经震惊全国的山东两女生状告教育部教育...

    2025-06-28
  • 重要的话说三遍:专业!专业!还是专业! 三十多岁的年纪依然吊...

    2025-06-28
  • 之前在北京拜访,有幸听过丁院士的航空知识课程。 我印象比较...

    2025-06-28
  • 0. 概览Swift 5.9 一声炮响为我们带来全新的宏(M...

    2025-06-28

关注我们

添加微信好友,关注最新动态