Skip to main content

OKHK 👀

个人数字泔水\(⁠◔⁠‿⁠◔⁠)
Thinking...
  1. Chenyme AAVT - 全自动视频/音频翻译工具

    https://github.com/Chenyme/Chenyme-AAVT

    一个简单易用的全自动视频(音频)识别、翻译工具,快速识别声音并翻译生成字幕文件,然后将翻译后的字幕与原视频合并,生成翻译后的视频。

    主要基于 OpenAI 开发的 Whisper 来识别声音和 LLMs 辅助翻译字幕 ,利用 Streamlit 搭建快速使用的 WebUI 界面,以及 FFmpeg 来实现字幕与视频的合并。

    #AI #Tool #Video #GitHub
  2. Insanely Fast Whisper - 音频转文字工具

    https://github.com/Vaibhavs10/insanely-fast-whisper

    https://replicate.com/vaibhavs10/incredibly-fast-whisper

    一个基于 OpenAI Whisper Large v3 模型的高速音频转文字工具,能够在不到 98 秒的时间内转录 300 分钟(5小时)音频。

    适用于多场景,支持 100 种语言的转录并支持翻译功能,提供按词或片段生成时间戳文本,方便字幕制作。

    提供命令列界面(CLI),也可以通过 Whisper API 进行线上语音转文字。

    #Voice #AI #GitHub #Tool
OKHK