surya - 开源文档 OCR 工具包
https://github.com/VikParuchuri/surya
Surya 是一个开源的文档 OCR 工具包
● 90 多种语言的 OCR,性能优于云服务
● 适用于各种文档,包括图像、PDF、Word 文档和 PowerPoint 演示文稿(PPT)
● 行级文本检测,版面布局分析(表格、图像、页眉、等检测)
● 阅读顺序检测
● 表格识别(检测行 / 列)
● LaTeX OCR
#OCR #Doc #Image #PDF #Tool #GitHub
https://github.com/VikParuchuri/surya
Surya 是一个开源的文档 OCR 工具包
● 90 多种语言的 OCR,性能优于云服务
● 适用于各种文档,包括图像、PDF、Word 文档和 PowerPoint 演示文稿(PPT)
● 行级文本检测,版面布局分析(表格、图像、页眉、等检测)
● 阅读顺序检测
● 表格识别(检测行 / 列)
● LaTeX OCR
#OCR #Doc #Image #PDF #Tool #GitHub