品玩12月24日讯,据 marketchpost 报道,Hume AI 近日推出一款语音语言模型OCTAVE,兼顾语言准确性和情感理解两大模型。
OCTAVE 将 Hume AI 的 EVI 2 语音语言模型与 OpenAI 的语音引擎、ElevenLab 的 TTS 语音设计和 Google DeepMind 的 NotebookLM 等先进系统的功能相结合。利用这些能力,OCTAVE 旨在提高人工智能驱动的交互的真实性和丰富性。它的潜在应用包括虚拟助手、互动故事和支持情感健康的工具。
OCTAVE 采用多模态神经架构,整合了声音、语言和情感信号。它在超过一百万个情感语音样本的不同数据集上进行了训练,每个样本都标注了详细的标签,以反映情感的类型和强度。这种训练使该模型能够检测到微妙的情绪线索,如讽刺、喜悦或沮丧,而传统模型往往会忽略这些线索。
0 条评论
请「登录」后评论