网站地图官方微信:
网站首页 瓦店镇 侯寨乡 蓼堤镇 昭平县 戈塘镇 寿丰乡

当前位置: 首页 >

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

当务之急最该解决的问题是大众对于 AI大模型的正确认知以及最基本的AI用法。

你看这是前两天的测试结果,突出了一个政治正确,6款大模型,OpenAI的o3倒数第一,我当时看到的时候就觉得很奇怪,o3好歹也是曾经的一代王者,高考数学这种题它排名这么低怕不是有什么猫腻。

我们就拿单选题的第五题来测试下,因为这道题除了o3,其他的国产模型都答对了。

这是第五题的原题,正确答案是A. - 1/2。

这是之前的第三方的测试结果,6个模型…。

如何看待机器之心重测高考数学全卷,Gemini夺冠,豆包DeepSeek并列第二?

  • | “哨兵模式”涉嫌泄密,你支持封杀特斯拉吗? |

    这就不得不聊下国企优秀的保密策略了。 企业内部的一些通用开...

    查看详情>>
  • | 为什么女生有体香? |

  • | 是不是 Mac Mini(M4) 不值得? |

  • | ***如中华文明能一直不受西方干扰自然演化,下一步会发展成什么样子? |

  • | flutter为什么不用Go语言,而用Dart? |

  • | 为什么这次以色列打伊朗,网上声讨的人少了,反而都是嘲笑调侃伊朗? |

  • | count(*) count(1)哪个更快? |

  • | 32岁程序员独立开发者纠结要不要回农村生活? |

  • | 你曾庆幸自己做过什么事? |

  • | 为什么CCTV-6总是能播一些连院线都上不了的电影? |

  • | 为什么现在的药品名都不直接写明治什么病,而是用一堆奇怪的音译名? |

  • 我开发了一个语言 herlang: justj***ac/h...

    2025-06-18
  • 丝柯克师父的角色预告一扫之前动画短片与角色 PV 带有的伤感...

    2025-06-18
  • 别说国内,国外都够呛 redis 和 elsaticsear...

    2025-06-18
  • 想要给妈妈买抗老护肤品,你首先要问自己一个问题:20+、30...

    2025-06-18

关注我们

添加微信好友,关注最新动态