TTS-WebUI - 集成多款主流语音合成与音频生成模型的开源 Web 界面

16:59 · 2025年9月26日 · 周五

TTS-WebUI - 集成多款主流语音合成与音频生成模型的开源 Web 界面

https://github.com/rsxdalv/tts-webui

TTS-WebUI 是一个基于 Gradio 和 React 的文本到语音 (TTS) 和音频生成的 Web 界面。

● 支持多种 TTS 和音频生成模型, 包括 Bark、Tortoise、MusicGen 等
● 提供了丰富的扩展功能, 可以安装额外的模型和工具
● 提供了基于 Gradio 的后端和基于 React 的前端界面
● 兼容 OpenAI API，支持 Whisper 转录，方便与 Silly Tavern 等客户端集成，实现多场景文本、语音交互。
● 支持在 Docker 容器中运行

#TTS #Voice #Tool #GitHub

GitHub

GitHub - rsxdalv/TTS-WebUI: A single Gradio + React WebUI with extensions for ACE-Step, OmniVoice, Kimi Audio, Piper TTS, GPT-SoVITS…

A single Gradio + React WebUI with extensions for ACE-Step, OmniVoice, Kimi Audio, Piper TTS, GPT-SoVITS, CosyVoice, XTTSv2, DIA, Kokoro, OpenVoice, ParlerTTS, Stable Audio, MMS, StyleTTS2, MAGNet,...