品玩4月17日讯,据 AIbase报道,OpenAI 近期推出了一项新系统,旨在监控其最新的 AI 推理模型 o3和 o4-mini,以阻止与生物和化学威胁相关的提示。
该系统的目标是防止模型提供可能教唆他人实施有害攻击的建议,确保 AI 的安全性。OpenAI 表示,o3和 o4-mini 在能力上较之前的模型有显著提升,因此在恶意用户手中可能带来新的风险。根据 OpenAI 的内部基准测试,o3在回答关于某些生物威胁的相关问题时,表现得尤为出色。为了应对这些风险,OpenAI 开发了这个新的监控系统,称之为 “以安全为中心的推理监测器”。
这个监测器经过定制训练,能够识别与生物和化学风险相关的提示,并指示模型拒绝提供这些主题的建议。

0 条评论
请「登录」后评论