https://github.com/breezedeus/Pix2Text
一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。
它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。
P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。
网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。
在线体验:https://huggingface.co/spaces/breezedeus/Pix2Text-Demo
网站版本:https://p2t.breezedeus.com/
相关
Pix2Text-Mac - 识别数学公式的 Mac 桌面版应用
CnOCR - 基于 PyTorch/MXNet 的中文/英文 OCR Python 包
CnSTD - 基于 PyTorch/MXNet 的 中文/英文 场景文字、数学公式检测、篇章分析的 Python3 包
#OCR #Image #Tool #GitHub