RealtimeVoiceChat - 实时语音聊天与 AI 自然对话使用 Docker 进行部署管理，适合用来实现语音助手和聊天机器人应用

15:22 · 2025年5月7日 · 周三

RealtimeVoiceChat - 实时语音聊天与 AI 自然对话

使用 Docker 进行部署管理，适合用来实现语音助手和聊天机器人应用

https://github.com/KoljaB/RealtimeVoiceChat

一个基于语音的实时人工智能聊天系统。它允许用户通过语音与一个大型语言模型(LLM)进行自然对话,并实时获得语音响应。该系统采用了一个复杂的客户端-服务器架构,以实现低延迟的交互体验。

1. 流畅的对话体验:用户可以像真实对话一样说话和倾听。
2. 实时反馈:用户可以看到部分转录和AI响应的实时更新。
3. 低延迟设计:优化的架构使用音频块流传输来实现低延迟。
4. 智能转话:动态静默检测(turndetect.py)可以适应对话节奏。
5. 灵活的AI大脑:可插拔的LLM后端(默认为Ollama,支持OpenAI)。
6. 可定制的语音:支持不同的文本到语音引擎(Kokoro、Coqui、Orpheus)。
7. 网页界面:使用原生JavaScript和Web Audio API实现简洁美观的UI。
8. 容器化部署:推荐使用Docker Compose进行更简单的依赖管理。

核心AI/ML库:
- RealtimeSTT (语音转文字)
- RealtimeTTS (文字转语音)
- transformers (转话检测, 分词)
- torch / torchaudio (机器学习框架)
- ollama / openai (LLM客户端)
音频处理: numpy, scipy

#GitHub #Voice #Tool #Docker #AI

GitHub

GitHub - KoljaB/RealtimeVoiceChat: Have a natural, spoken conversation with AI!

Have a natural, spoken conversation with AI! Contribute to KoljaB/RealtimeVoiceChat development by creating an account on GitHub.