品玩

科技创新者的每日必读

打开APP
关闭

OpenAI 新模型存在严重幻觉问题

3小时前

品玩4月21日讯,据techCrunch 报道,OPenAI 最近推出的 o3 和 o4-mini 模型被曝存在严重的幻觉问题。

根据 OpenAI 的内部测试,o3 和 o4-mini比该公司之前的推理模型(o1、o1-mini 和 o3-mini)以及 OpenAI 传统的 “非推理 ”模型(如 GPT-4o)更容易产生幻觉。OpenAI 在其关于 o3 和 o4-mini 的技术报告中写道,“需要进行更多的研究”,以了解为什么随着推理模型的扩大,幻觉会越来越严重。

OpenAI 发现,o3 在回答 PersonQA 中 33% 的问题时产生了幻觉,而 PersonQA 是公司内部衡量模型对人的认知准确性的基准。这大约是OpenAI之前的推理模型o1和o3-mini出现幻觉率的两倍,o1和o3-mini的幻觉率分别为16%和14.8%。O4-mini在PersonQA上的表现更糟--48%的时间出现幻觉。

取消 发布

下载品玩App,比99.9%的人更先知道关于「OpenAI」的新故事

下载品玩App

比99.9%的人更先知道关于「OpenAI」的新故事

iOS版本 Android版本
立即下载
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测