网站地图官方微信:
网站首页 八岔乡 坪山区 波密乡 往洞镇 宁强县 褒忠乡

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | 谁有这个系列的壁纸啊? |

    啧……要命。 这个是一个叫“学妹加速跑”(没错,真的叫这个...

    查看详情>>
  • | 同样源于Unix,是不是Linux的桌面图形用户界面(GUI)没有MacOS流畅? |

  • | 几年前吹的神乎其神的朱姆沃尔特舰为什么现在销声匿迹了? |

  • | 穿瑜伽裤爬山的女生会不会害羞? |

  • | 腰椎间盘突出导致腿麻脚麻怎么办? |

  • | 孩子画过什么画让你非常震惊? |

  • | 为何 Linus 一个人就能写出这么强的系统,中国却做不出来? |

  • | 用GraphQL如何实现以下API请求?与REST的思路相比实现方法孰优孰劣? |

  • | 用PHP写了个小框架,怎么才能得到大佬们的指点? |

  • | 华为自研的仓颉编程语言将于 7 月 30 日开源,这款语言将如何影响未来的开发趋势? |

  • | springboot框架中一个controller类可以调用多个service类吗? |

  • 不能,没有一丁点可能 根据海关总署数据,2024年共进口 小...

    2025-06-25
  • 题主的问题描述里有最好能用到AI,这个开源混合型多模态AI搜...

    2025-06-25
  • 2023年本来就是固态硬盘最便宜的一年,400多的价格可以直...

    2025-06-25
  • 首先写 bug 很正常,就像写文章会写错别字,做数学题会犯错...

    2025-06-25

关注我们

添加微信好友,关注最新动态