Skip to main content

RealtimeVoiceChat - 实时语音聊天与 AI 自然对话使用 Docker 进行部署管理,适合用来实现语音助手和聊天机器人应用

  1. RealtimeVoiceChat - 实时语音聊天与 AI 自然对话

    使用 Docker 进行部署管理,适合用来实现语音助手和聊天机器人应用

    https://github.com/KoljaB/RealtimeVoiceChat

    一个基于语音的实时人工智能聊天系统。它允许用户通过语音与一个大型语言模型(LLM)进行自然对话,并实时获得语音响应。该系统采用了一个复杂的客户端-服务器架构,以实现低延迟的交互体验。

    1. 流畅的对话体验:用户可以像真实对话一样说话和倾听。
    2. 实时反馈:用户可以看到部分转录和AI响应的实时更新。
    3. 低延迟设计:优化的架构使用音频块流传输来实现低延迟。
    4. 智能转话:动态静默检测(turndetect.py)可以适应对话节奏。
    5. 灵活的AI大脑:可插拔的LLM后端(默认为Ollama,支持OpenAI)。
    6. 可定制的语音:支持不同的文本到语音引擎(Kokoro、Coqui、Orpheus)。
    7. 网页界面:使用原生JavaScript和Web Audio API实现简洁美观的UI。
    8. 容器化部署:推荐使用Docker Compose进行更简单的依赖管理。

    核心AI/ML库:
    - RealtimeSTT (语音转文字)
    - RealtimeTTS (文字转语音)
    - transformers (转话检测, 分词)
    - torch / torchaudio (机器学习框架)
    - ollama / openai (LLM客户端)
    音频处理: numpy, scipy

    #GitHub #Voice #Tool #Docker #AI GitHub - KoljaB/RealtimeVoiceChat: Have a natural, spoken conversation with AI!
OKHK