Pix2Text - 开源多功能图像内容识别工具

https://github.com/breezedeus/Pix2Text

一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。

它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。

P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。

网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。

在线体验:https://huggingface.co/spaces/breezedeus/Pix2Text-Demo

网站版本:https://p2t.breezedeus.com/

相关

Pix2Text-Mac - 识别数学公式的 Mac 桌面版应用

CnOCR - 基于 PyTorch/MXNet 的中文/英文 OCR Python 包

CnSTD - 基于 PyTorch/MXNet 的 中文/英文 场景文字、数学公式检测、篇章分析的 Python3 包

#OCR #Image #Tool #GitHub
 
 
Back to Top
OKHK