品玩8月22日讯,谷歌官方宣布,推出一款全新的语音转换系统,可以复制用户音色的同时帮助他们进行交流。
谷歌研究出了一种全新的领镜头语音转换模型,可以轻松插入最先进的 TTS 系统,以还原输入说话者的声音。该模块既可在说话人已存储少量语音集的情况下使用,也可在非典型语音是唯一可用数据的情况下使用。
实验证明,即使输入的参考语音是非典型的,同一模型也能生成高质量的语音,并能高保真地保留讲话者的音色,这对那些没有语音库或从未有过典型语音的人来说非常有用。
谷歌发布新款语音转换系统,帮助残障人士沟通
2024年8月22日品玩8月22日讯,谷歌官方宣布,推出一款全新的语音转换系统,可以复制用户音色的同时帮助他们进行交流。
谷歌研究出了一种全新的领镜头语音转换模型,可以轻松插入最先进的 TTS 系统,以还原输入说话者的声音。该模块既可在说话人已存储少量语音集的情况下使用,也可在非典型语音是唯一可用数据的情况下使用。
实验证明,即使输入的参考语音是非典型的,同一模型也能生成高质量的语音,并能高保真地保留讲话者的音色,这对那些没有语音库或从未有过典型语音的人来说非常有用。
下载品玩App,比99.9%的人更先知道关于「谷歌」的新故事
下载品玩App
比99.9%的人更先知道关于「谷歌」的新故事
0 条评论
请「登录」后评论