IndexTTS2是B站语音团队开发的新型文本转语音(TTS)模型,支持零样本声音克隆,仅需一个音频文件即可精准复制音色、节奏和说话风格,支持多语言。IndexTTS2实现了情感音色分离控制,用户可以独立指定音色来源和情绪来源。模型具备多模态情感输入功能,支持通过情感参考音频、情感描述文本或情感向量来控制情感。

ComfyUI-TTS2整合包下载:
链接:https://pan.quark.cn/s/a3b1f33928e6 提取码:NfA4
IndexTTS2是B站语音团队开发的新型文本转语音(TTS)模型,支持零样本声音克隆,仅需一个音频文件即可精准复制音色、节奏和说话风格,支持多语言。IndexTTS2实现了情感音色分离控制,用户可以独立指定音色来源和情绪来源。模型具备多模态情感输入功能,支持通过情感参考音频、情感描述文本或情感向量来控制情感。

ComfyUI-TTS2整合包下载:
链接:https://pan.quark.cn/s/a3b1f33928e6 提取码:NfA4