品玩7月22日讯,据 Venturebeat 报道,苹果公司的研究团队在 Hugging Face 上发布了一系列开放的 DCLM 模型。
该系列包括两个主要模型:一个有 70 亿个参数,另一个有 14 亿个参数。这两个模型在基准测试中的表现都相当不错,尤其是较大的那个模型--其性能超过了 Mistral-7B,并正在接近其他领先的开放模型,包括 Llama 3 和 Gemma。
值得注意的是,随着模型权重、训练代码和预训练数据集的发布,该项目真正实现了开源。
苹果开源小模型 DCLM-Baseline-7
2024年7月22日品玩7月22日讯,据 Venturebeat 报道,苹果公司的研究团队在 Hugging Face 上发布了一系列开放的 DCLM 模型。
该系列包括两个主要模型:一个有 70 亿个参数,另一个有 14 亿个参数。这两个模型在基准测试中的表现都相当不错,尤其是较大的那个模型--其性能超过了 Mistral-7B,并正在接近其他领先的开放模型,包括 Llama 3 和 Gemma。
值得注意的是,随着模型权重、训练代码和预训练数据集的发布,该项目真正实现了开源。
下载品玩App,比99.9%的人更先知道关于「苹果」的新故事
下载品玩App
比99.9%的人更先知道关于「苹果」的新故事
0 条评论
请「登录」后评论