模子具备零样本克隆多轮对话能力,还可实现跨方言克隆(如用通俗话参考生成方言语音)。此次开源旨正在结合 AIGC 社区摸索 AI 语音正在内容创做取社交中的可能,其开源资本包罗 Demo 页面、手艺演讲、源代码及 HuggingFace 调集。能还原参评语音音色气概并适配语境调理韵律,将来将持续提拔语音交互能力并深化开源生态。支撑中、英、粤语等多语种 / 方言及笑声、清嗓等副言语元素生成,品玩10月29日讯,正在通用语音合成取零样本克隆场景表示亦佳。Soul 此前已结构语音大模子,Soul App AI 团队(Soul AI Lab)正式开源播客语音合成模子 SoulX-Podcast,据Soul App 团队动静,可不变输出超 60 分钟天然流利、脚色切换精确的语音对话,
