网站地图官方微信:
网站首页 民营区 新华镇 海阳市 白楼乡 墨红镇 会师镇

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | 组nas一定要TDP低的cpu吗? |

    不一定,我直接说一下实例对比一下,你就懂了 很多人是因为不具...

    查看详情>>
  • | 独立开发者如何发现机会? |

  • | 真的有这种又苗条身材又爆炸的么? |

  • | 为什么用 electron 开发的桌面应用那么多? |

  • | vue + tsx 的开发体验能追得上 react+tsx么? |

  • | 年薪三十万,让你驻扎非洲,你愿意吗? |

  • | 为什么现在女孩子爱好烘焙,在相亲中也成了槽点了? |

  • | 世界上右捺子多 但为什么是不惯用的左手去用复杂的键盘? |

  • | 直接躺下更方便,为什么人会进化成需要枕头? |

  • | 为什么不能用普通电机加变速齿轮的方式离心、提纯核原料? |

  • | 如何评价鸿蒙电脑无法编写其自身运行的程序? |

  • 买一台境外的服务器,再买一台境内的服务器。 配置要一样。 ...

    2025-06-29
  • 多年jb付费用户。 最近因为新公司用的js+jsdoc+d...

    2025-06-29
  • 2001年时候,买的第一台电脑,还记得配置是速龙1.2G,内...

    2025-06-29
  • 有些东西记忆深刻,但如果今天再变一个出来,它不一定有那么神了...

    2025-06-29

关注我们

添加微信好友,关注最新动态