Skip to main content

surya - 开源文档 OCR 工具包

  1. surya - 开源文档 OCR 工具包

    https://github.com/VikParuchuri/surya

    Surya 是一个开源的文档 OCR 工具包

    90 多种语言的 OCR,性能优于云服务
    适用于各种文档,包括图像、PDF、Word 文档和 PowerPoint 演示文稿(PPT)
    行级文本检测,版面布局分析(表格、图像、页眉、等检测)
    阅读顺序检测
    表格识别(检测行 / 列)
    LaTeX OCR

    #OCR #Doc #Image #PDF #Tool #GitHub GitHub - datalab-to/surya: OCR, layout analysis, reading order, table recognition in 90+ languages
OKHK