品玩1月21日讯,据 TechCrunch 报道,近日一项针对大模型的数学基准测试遭到公正性质疑,主要原因是该测试被曝由OpenAI 资助。
Epoch AI是一家主要由研究和资助基金会Open Philanthropy资助的非营利组织,它在12月20日透露,OpenAI支持了FrontierMath的创建。FrontierMath是一个包含专家级问题的测试,旨在衡量人工智能的数学技能,是OpenAI用来演示其即将推出的旗舰人工智能o3的基准之一。
除了支持 FrontierMath,OpenAI 还能看到基准中的许多问题和解决方案--在 12 月 20 日 o3 公布之前,Epoch AI 并未透露这一事实。
0 条评论
请「登录」后评论