品玩5月30日讯,据新智元报道, Meta 近日发布了一种全新的模型架构,可以有效减少算力损耗。
据报道,Meta 的这个模型架构被称为 Megabyte,是一种多尺度解码器架构,可以对超过一百万字节的序列进行端到端可微分建模。Megabyte 能跨多种格式生成超过100万个token,并超越GPT-4等模型背后的现有 Transformer架构的功能。

Meta发布全新Megabyte模型,解决算力损耗硬伤
2023年5月30日品玩5月30日讯,据新智元报道, Meta 近日发布了一种全新的模型架构,可以有效减少算力损耗。
据报道,Meta 的这个模型架构被称为 Megabyte,是一种多尺度解码器架构,可以对超过一百万字节的序列进行端到端可微分建模。Megabyte 能跨多种格式生成超过100万个token,并超越GPT-4等模型背后的现有 Transformer架构的功能。
下载品玩App,比99.9%的人更先知道关于「算力」的新故事
下载品玩App
比99.9%的人更先知道关于「算力」的新故事
0 条评论
请「登录」后评论