surya - 开源文档 OCR 工具包

https://github.com/VikParuchuri/surya

Surya 是一个开源的文档 OCR 工具包

90 多种语言的 OCR,性能优于云服务
适用于各种文档,包括图像、PDF、Word 文档和 PowerPoint 演示文稿(PPT)
行级文本检测,版面布局分析(表格、图像、页眉、等检测)
阅读顺序检测
表格识别(检测行 / 列)
LaTeX OCR

#OCR #Doc #Image #PDF #Tool #GitHub GitHub - datalab-to/surya: OCR, layout analysis, reading order, table recognition in 90+ languages
 
 
Back to Top
OKHK