苹果研究人员称其设备端模型 ReALM 性能优于 GPT-4，可大幅提升 Siri 智能程度-品玩

品玩4月2日讯，据 51CTO 报道，在最近的一篇研究论文中，苹果的人工智能团队描述了一种可以显著提升 Siri 智能的模型，而且他们认为这个名为 ReALM 的模型在测试中优于 OpenAI 的知名语言模型 GPT-4.0。

ReALM 的特别之处在于，它可以同时理解用户屏幕上的内容和正在进行的操作。论文将信息分为以下三种类型：屏幕实体：指的是当前显示在用户屏幕上的内容；对话实体：指的是与对话相关的内容。例如，用户说“打电话给妈妈”，那么妈妈的联系人信息就是对话实体；背景实体：指的是与用户当下操作或屏幕显示内容可能并不直接相关的实体，比如正在播放的音乐或即将响起的闹铃。

如果能够完美运行，ReALM 将使 Siri 变得更加智能和实用。他们将 ReALM 与 OpenAI 的 GPT-3.5 和 GPT-4.0 进行了性能对比：

“我们同时测试了 OpenAI 提供的 GPT-3.5 和 GPT-4.0 模型，并为它们提供了上下文信息，让它们预测一系列可能的实体。GPT-3.5 只接受文本输入，因此我们只提供了文字提示。而 GPT-4 能够理解图像信息，因此我们为它提供了屏幕截图，这显著提升了它的屏幕实体识别性能。”

论文的结论之一是，ReALM 即使拥有比 GPT-4 少得多的参数，也能在性能上与之匹敌，并且在处理特定领域的用户指令时表现更加出色，这使得 ReALM 成为一种可以在设备端运行的、实用高效的实体识别系统。