TTS-WebUI - 集成多款主流语音合成与音频生成模型的开源 Web 界面

https://github.com/rsxdalv/tts-webui

TTS-WebUI 是一个基于 Gradio 和 React 的文本到语音 (TTS) 和音频生成的 Web 界面。

支持多种 TTS 和音频生成模型, 包括 Bark、Tortoise、MusicGen 等
提供了丰富的扩展功能, 可以安装额外的模型和工具
提供了基于 Gradio 的后端和基于 React 的前端界面
兼容 OpenAI API,支持 Whisper 转录,方便与 Silly Tavern 等客户端集成,实现多场景文本、语音交互。
支持在 Docker 容器中运行

#TTS #Voice #Tool #GitHub GitHub - rsxdalv/TTS-WebUI: A single Gradio + React WebUI with extensions for ACE-Step, Kimi Audio, Piper TTS, GPT-SoVITS, CosyVoice…
 
 
Back to Top
OKHK