Skip to main content

OKHK 👀

个人数字泔水\(⁠◔⁠‿⁠◔⁠)
Thinking...
  1. zh_recogn - 中文语音识别 srt 字幕导出工具

    https://github.com/jianchang512/zh_recogn

    一个中文语音识别为字幕的项目,支持中文音频、视频转为 srt 字幕,基于魔塔社区 Paraformer 模型,提供 api 接口和简单界面。

    项目仅支持中文语音识别,非中文语音可以利用基于 OpenAI Whisper 和 Faster-Whisper 的项目,如 pyvideotransstt,目的是为了弥补国外模型在中文支持方面的不足。

    #AI #Tool #GitHub #Voice
  2. NopeCHA - AI 自动 CAPTCHA 验证码识别插件

    https://github.com/NopeCHALLC/nopecha-extension

    一个可以自动识别 CAPTCHA 验证码的 AI 工具,支持识别所有版本的 reCAPTCHA、FunCAPTCHA、hCaptcha、WAF 验证码、300+ 文本验证码类型和 Cloudflare 验证等。

    免费用户每 24 小时最多 100 次识别,对于个人应该够用。并且与 Selenium、Puppeteer 和 Playwright 等自动化工具兼容。


    Buster - 自动跳过 reCAPTCHA 验证插件
    https://github.com/dessant/buster

    #AI #Tool #GitHub #Chrome #Extension
  3. Pix2Text - 开源多功能图像内容识别工具

    https://github.com/breezedeus/Pix2Text

    一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。

    它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。

    P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。

    网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。

    在线体验:https://huggingface.co/spaces/breezedeus/Pix2Text-Demo

    网站版本:https://p2t.breezedeus.com/

    相关

    Pix2Text-Mac - 识别数学公式的 Mac 桌面版应用

    CnOCR - 基于 PyTorch/MXNet 的中文/英文 OCR Python 包

    CnSTD - 基于 PyTorch/MXNet 的 中文/英文 场景文字、数学公式检测、篇章分析的 Python3 包

    #OCR #Image #Tool #GitHub
OKHK