OpenAI 资助 AI 数学基准测试引发公正性质疑-品玩

OpenAI 资助 AI 数学基准测试引发公正性质疑

4小时前

品玩1月21日讯，据 TechCrunch 报道，近日一项针对大模型的数学基准测试遭到公正性质疑，主要原因是该测试被曝由OpenAI 资助。

Epoch AI是一家主要由研究和资助基金会Open Philanthropy资助的非营利组织，它在12月20日透露，OpenAI支持了FrontierMath的创建。FrontierMath是一个包含专家级问题的测试，旨在衡量人工智能的数学技能，是OpenAI用来演示其即将推出的旗舰人工智能o3的基准之一。

除了支持 FrontierMath，OpenAI 还能看到基准中的许多问题和解决方案--在 12 月 20 日 o3 公布之前，Epoch AI 并未透露这一事实。