品玩4月3日讯,据 AIBASE 报道,字节跳动近日发布其最新的文本转语音(TTS)模型MegaTTS3。根据技术社区反馈和官方信息,MegaTTS3 被誉为语音合成领域的一次重要进步。
MegaTTS3 是一款由字节跳动与浙江大学合作开发的开源语音合成工具,其主干模型仅包含0. 45 亿个参数,相较于传统大型TTS模型显得异常轻量。这一设计不仅降低了计算资源需求,还使其更适合在资源受限的设备上部署,例如移动设备或边缘计算场景。
该模型支持中文和英文语音生成,并具备独特的中英混合朗读能力,能够自然流畅地处理双语文本。此外,MegaTTS3 还引入了口音强度控制功能,用户可以通过调整参数生成带有不同程度口音的语音,为个性化语音应用提供了更多可能性。技术专家在评论中特别指出:"支持口音强度控制,这一点非常亮眼。"

0 条评论
请「登录」后评论