OpenAI 发布新系统，防止模型发布危险内容-品玩

OpenAI 发布新系统，防止模型发布危险内容

4月17日

品玩4月17日讯，据 AIbase报道，OpenAI 近期推出了一项新系统，旨在监控其最新的 AI 推理模型 o3和 o4-mini，以阻止与生物和化学威胁相关的提示。

该系统的目标是防止模型提供可能教唆他人实施有害攻击的建议，确保 AI 的安全性。OpenAI 表示，o3和 o4-mini 在能力上较之前的模型有显著提升，因此在恶意用户手中可能带来新的风险。根据 OpenAI 的内部基准测试，o3在回答关于某些生物威胁的相关问题时，表现得尤为出色。为了应对这些风险，OpenAI 开发了这个新的监控系统，称之为 “以安全为中心的推理监测器”。

这个监测器经过定制训练，能够识别与生物和化学风险相关的提示，并指示模型拒绝提供这些主题的建议。