品玩12月2日讯,据 The Decoder 报道,Adobe Research 和密歇根大学的研究人员今日推出一款名为 MultiForey 的AI 系统,可以为视频生成定制音效。
据报道 MultiFoley可以帮助用户通过文本提示、参考音频或视频示例来创建声音。MultiFoley 是首个将多种输入方法(文本、音频和视频参考)整合到一个模型中的系统。它通过一种专门的机制,以每秒 8 帧的速度分析视觉特征,然后将其放大以匹配 40 Hz 的音频采样率,从而保持视频和生成音频之间的紧密同步。
据悉,Adoeb 将会在不久后发布 MultiFoley的源代码和模型。
0 条评论
请「登录」后评论