品玩12月20日讯,据ElevenLabs消息,ElevenLabs近期推出了其最新的人声合成模型Flash,声称这是迄今为止最快的文本转语音解决方案。
新模型生成语音的延迟仅为75毫秒,特别适合低延迟的对话式语音助手。Flash模型分为两个版本,其中Flash v2仅支持英语,而Flash v2.5则支持32种语言。
尽管在音质和情感深度上稍逊于Turbo模型,但Flash在盲测中表现优异,成为速度最快的选择。
ElevenLabs推Flash语音对话模型:仅75毫秒延迟 支持32种语言
12月20日品玩12月20日讯,据ElevenLabs消息,ElevenLabs近期推出了其最新的人声合成模型Flash,声称这是迄今为止最快的文本转语音解决方案。
新模型生成语音的延迟仅为75毫秒,特别适合低延迟的对话式语音助手。Flash模型分为两个版本,其中Flash v2仅支持英语,而Flash v2.5则支持32种语言。
尽管在音质和情感深度上稍逊于Turbo模型,但Flash在盲测中表现优异,成为速度最快的选择。
下载品玩App,比99.9%的人更先知道关于「ElevenLabs」的新故事
下载品玩App
比99.9%的人更先知道关于「ElevenLabs」的新故事
0 条评论
请「登录」后评论