Pix2Text - 开源多功能图像内容识别工具

Pix2Text - 开源多功能图像内容识别工具

https://github.com/breezedeus/Pix2Text

一款开源 Python3 工具，可以识别图片中的版面、表格、图片、文字、数学公式等内容，并整合所有内容后以 Markdown 格式输出。

它是 Mathpix 的免费替代品，可将视觉内容无缝转换为基于文本的表述，支持 80 多种语言。

P2T 也可以把一整个 PDF 文件（PDF 的内容可以是扫描图片或者其他任何格式）转换为 Markdown 格式。

网页版每人每天可以免费识别 10000 个字符，正常使用应该够用了。

在线体验：https://huggingface.co/spaces/breezedeus/Pix2Text-Demo

网站版本：https://p2t.breezedeus.com/

相关

Pix2Text-Mac - 识别数学公式的 Mac 桌面版应用

CnOCR - 基于 PyTorch/MXNet 的中文/英文 OCR Python 包

CnSTD - 基于 PyTorch/MXNet 的中文/英文场景文字、数学公式检测、篇章分析的 Python3 包

#OCR #Image #Tool #GitHub