碎片收藏 / 资讯文档 / 网站工具 / GitHub 项目 / Bing 壁纸
BentoPDF - 开源 PDF 工具集合

https://github.com/alam00000/bentopdf

BentoPDF 是一个注重隐私的开源 PDF 工具集合,所有处理都在客户端浏览器中进行,无需服务器处理。

项目提供超过 50 种 PDF 操作工具,覆盖编辑、转换、安全、优化等多个维度。

PDF 组织管理:合并、分割、重新排序、提取、删除、旋转页面,支持拖放操作
PDF 编辑修改PDF 编辑器、创建可填充表单、添加页码、水印、页眉页脚等
● 格式转换:图片转 PDF(JPG/PNG/WebP/SVG 等)、Markdown/ 文本 /EPUB 转 PDFPDF 转图片 /JSON/ 灰度等
● 安全优化:压缩、修复、加密 / 解密、数字签名、去除元数据、内容编辑等
● OCR 识别:使光学字符识别使扫描 PDF 可搜索
● 高级功能PDF 比较、添加附件、OCR、数字签名等 50+ 工具
易于使用与部署:支持多种方式进行本地运行和自行托管,包括 Docker 和静态文件部署
技术栈现代:基于 Vite、TypeScript 和 Tailwind CSS 构建,性能优越且易于维护

#PDF #Tool #GitHub

相关https://github.com/Stirling-Tools/Stirling-PDF GitHub - alam00000/bentopdf: A Privacy First PDF Toolkit
Scribe OCR - 对图片 / PDF 文件进行 OCR 数字化校对

https://scribeocr.com/

https://github.com/scribeocr/scribeocr

Scribe OCR 是一款免费的 Web 应用,可以当作 Adobe Acrobat 等应用的简单替代品。

专注于图像文本识别、高效 OCR 数据校对及创建完全数字化的原生文本文档,能够将扫描内容转换为准确、可搜索且可编辑的数字格式,包括电子书风格的 PDF 文档。

免费的网页端文本识别、OCR 校对及文档数字化应用。
完全基于浏览器客户端运行,确保数据隐私安全。
通过优化文本叠加和定制字体生成,实现精准校对。

#OCR #Image #PDF #Tool #GitHub
surya - 开源文档 OCR 工具包

https://github.com/VikParuchuri/surya

Surya 是一个开源的文档 OCR 工具包

90 多种语言的 OCR,性能优于云服务
适用于各种文档,包括图像、PDF、Word 文档和 PowerPoint 演示文稿(PPT)
行级文本检测,版面布局分析(表格、图像、页眉、等检测)
阅读顺序检测
表格识别(检测行 / 列)
LaTeX OCR

#OCR #Doc #Image #PDF #Tool #GitHub GitHub - datalab-to/surya: OCR, layout analysis, reading order, table recognition in 90+ languages
PDFQFZ - PDF 文件加盖骑缝章工具

https://github.com/flytkgl/PDFQFZ)

PDFQFZ 是一个 PDF 加盖骑缝章的小工具。

用户选择需要盖章的 PDF 文件或文件夹,导入完整的印章图片,并根据 PDF 页数自动分割印章。

可以设定印章大小、骑缝章位置和印章位置等参数,点击 " 盖章 " 后即可在保存文件夹中看到盖好骑缝章的 PDF 文件。

#PDF #Tool #GitHub
Marker - 将 PDF 快速转换为 Markdown / JSON / HTML

https://github.com/datalab-to/marker

API 版本: https://github.com/adithya-s-k/marker-api

Marker 是一个将 PDF 文档转换为 Markdown、JSON 和 HTML 的工具,快速准确。

支持多种文件格式(PDF、图像、PPTX、DOCX、XLSX、HTML、EPUB)和多种语言的转换
格式化表格、公式、内联数学、链接、引用和代码块
提取和保存图像,移除页眉 / 页脚等
可通过 LLM 提高转换准确度

#PDF #Tool #GitHub GitHub - datalab-to/marker: Convert PDF to markdown + JSON quickly with high accuracy
invoicely - 发票(商业账单 / 凭证)生成平台

https://github.com/legions-developer/invoicely

https://invoicely.gg

Invoicely 是一个基于 Next.js、tRPC 和 TypeScript 构建的现代化、开源的发票生成平台。

项目提供了一个简单易用的界面,用户可以在几分钟内创建专业的发票。

基于 Next.js 的现代化 Web 应用程序
使用 tRPC 实现端到端的类型安全 API
采用 TypeScript 进行类型安全开发
集成 Drizzle ORM 进行数据库操作
支持 Cloudflare R2 进行文件存储
提供 Google OAuth 社交登录功能
使用 Zod 进行数据验证
集成 PostHog 和 OpenPanel 进行分析和监控

#GitHub #Tool #PDF #Design GitHub - legions-developer/invoicely: Invoicely is a simple and easy to use invoice generator where you can create beautiful and…
OfficeViewer - 浏览器查看 Office 文件

https://officeviewer.org/

Office Viewer 提供免费在线文档、CSV 和压缩文件查看服务。无需安装 Office 应用, 在浏览器内查看 Office 文件的服务。

支持多种常见格式,包括 Word (.docx)、Excel (.xlsx)、PowerPoint (.pptx)、PDF (.pdf)、CSV (.csv)、ZIP (.zip) 和 RAR (.rar)。
所有文件处理均在用户浏览器中进行,文件不会上传到服务器,保障用户隐私和安全,无需注册或提供个人信息。
CSV 文件支持查看、搜索、排序和高级筛选功能。
压缩文件支持浏览内容、预览文件和下载单个项目,无需完整解压。
采用 Vue.js、Nuxt.js 等现代 Web 技术构建,基于 vue office 项目。

#URL #PDF #Doc #Tool #GitHub Open Word, Excel & PPT Online - Free & Secure Office Viewer
免费 PDF 软件

https://www.pdfgear.com/

PDFgear 是一款完全免费的 PDF 软件,提供阅读、编辑、转换、合并和签署 PDF 文件功能,无需注册。

主要功能包括 PDF 文档编辑(文本、图像、签名等)、PDF 注释(高亮、评论等)、PDF 转换(批量高速转换)和 OCR 图文识别(从图像中提取文本,支持多语言)。

除了桌面软件,PDFgear 还提供数十种免费在线工具,用于快速完成 PDF 任务,例如编辑、转换、分割、合并和压缩 PDF

#URL #Tool #PDF PDFgear - Free PDF Editor Software & Online tools
免费 PDF 编辑器 - 无需安装,无需上传

https://breezepdf.com

Breeze PDF 是一个强大的免费 PDF 编辑器,可以在浏览器内离线使用,确保用户隐私,不需要上传文件。用户的文件始终保存在本地计算机上,确保数据安全。

添加文本:可以轻松在 PDF 文档的任意位置输入和添加文本。
添加图片:支持直接在 PDF 页面中插入 JPG 或 PNG 格式的图片。
添加签名:允许用户通过绘制、输入或上传的方式进行数字签名。
表单字段:可以添加互动文本输入框,制作可填写的表单。
合并 PDF:将多个 PDF 文件合并为一个文档。
删除页面:轻松移除 PDF 文件中不需要的页面。
密码保护:使用强密码加密保护敏感的 PDF 文档。

https://news.ycombinator.com/item?id=43880962

#PDF #Tool #URL #Editor
PDF Craft

https://github.com/oomol-lab/pdf-craft

PDF Craft 是一个可以将 PDF 文件转换为各种其他格式的项目。

该项目主要专注于处理扫描书籍的 PDF 文件。

1. 可以逐页读取 PDF 页面,并使用 DocLayout-YOLO 结合自编算法提取书籍页面的文本,并过滤掉页眉、页脚、脚注和页码等元素。
2. 在跨页处理过程中,算法会用于正确处理前后页之间的连接问题,最终生成语义连贯的文本。
3. 使用 OnnxOCR 进行文本识别,并使用 layoutreader 确定符合人类习惯的阅读顺序。
4. 仅使用可在本地执行的 AI 模型(使用本地图形设备加速),即可将 PDF 文件转换为 Markdown 格式。
5. 对于超过 100 页的书籍,建议转换为 EPUB 格式文件。在转换过程中,该库会将本地 OCR 识别的数据传递给 LLM,并通过特定信息(如目录等)构建书籍结构,最终生成带有目录和章节的 EPUB 文件。

#PDF #Tool #GitHub #AI GitHub - oomol-lab/pdf-craft: PDF craft can convert PDF files into various other formats. This project will focus on processing…
MarkPDFDown - PDF 转 Markdown 工具

https://github.com/MarkPDFdown/markpdfdown

MarkPDFDown 是一款强大的工具,它利用 AI 多模态大型语言模型将 PDF 文件转录为 Markdown 格式。

该工具可以准确地提取文本,保留格式,并处理包括表格、公式和图表在内的复杂文档结构。

PDF 转 Markdown 转换:将任何 PDF 文档转换为格式良好的 Markdown
图像转 Markdown 转换:将图像转换为格式良好的 Markdown
多模态理解:利用 AI 理解文档结构和内容
格式保留:保留标题、列表、表格和其他格式元素
可定制模型:可根据需求配置模型

#PDF #Tool #GitHub #AI GitHub - MarkPDFdown/markpdfdown: A high-quality PDF to Markdown tool based on large language model visual recognition. 一款基于大模…
OKHK 🐟
BabelDOC 开源 PDF 翻译工具 精准保持公式表格排版的学术翻译神器 https://github.com/funstory-ai/BabelDOC https://funstory-ai.github.io/BabelDOC/ BabelDOC 是一个 PDF 科学论文翻译和双语比较库,支持自部署和在线服务。 它提供了简单的命令行界面和 Python API,主要设计用于嵌入到其他程序中使用,但也可以直接用于简单的翻译任务。 ● 提供 PDF 文档的解析和渲染功能 ● 支持多种翻译服务…
沉浸式翻译新工具——BabelDOC

https://app.immersivetranslate.com/babel-doc/
#PDF #Tool #URL #AI

支持在翻译 PDF 的时候保持文件的原始排版,而且还能完整提取 PDF 内嵌的图表、脚注、公式等⾮⽂本元素。
MinerU - PDF 转换 Markdown / JSON 工具

https://github.com/opendatalab/MinerU

MinerU 是一个高质量的 PDF 内容提取工具包,可将 PDF 文档转换为可读格式(如 Markdown、JSON),方便进一步处理和分析。

它专注于解决科技文献中的符号转换问题,为大模型时代的技术发展做出贡献。与知名商业产品相比,MinerU 还在不断完善和优化中。

移除页眉、页脚、脚注、页码等,确保语义连贯性
按阅读顺序输出文本,适用于单栏、多栏和复杂布局
保留原文档的结构,包括标题、段落、列表等
提取图像、图像描述、表格、表格标题和脚注
自动识别并转换文档中的公式为 LaTeX 格式
自动识别并转换文档中的表格为 HTML 格式
自动检测扫描 PDF 和乱码 PDF,并启用 OCR 功能
OCR 支持 84 种语言的检测和识别
支持多种输出格式,如多模态 Markdown、按阅读顺序排序的 JSON,以及丰富的中间格式

#PDF #Tool #GitHub GitHub - opendatalab/MinerU: Transforms complex documents like PDFs into LLM-ready markdown/JSON for your Agentic workflows.
BabelDOC 开源 PDF 翻译工具 精准保持公式表格排版的学术翻译神器

https://github.com/funstory-ai/BabelDOC

https://funstory-ai.github.io/BabelDOC/

BabelDOC 是一个 PDF 科学论文翻译和双语比较库,支持自部署和在线服务。

它提供了简单的命令行界面和 Python API,主要设计用于嵌入到其他程序中使用,但也可以直接用于简单的翻译任务。

提供 PDF 文档的解析和渲染功能
支持多种翻译服务,如 OpenAI
支持双语 PDF 输出
提供离线资产管理功能

#GitHub #PDF #Tool GitHub - funstory-ai/BabelDOC: Yet Another Document Translator
Stirling-PDF

一个强大的、本地托管的基于 Web 的 PDF 操作工具,使用 Docker 构建。

它可以执行各种 PDF 文件操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等。

这个可本地私有部署的 Web 应用程序已经发展成为一个全面的功能集,满足所有 PDF 需求。

50 多种 PDF 操作
并行文件处理和下载
暗模式支持
自定义下载选项
自定义"管道"以自动化队列运行多个功能
与外部脚本集成的 API
可选的登录和身份验证支持
数据库备份和导入
企业级功能,如单点登录

Java, Docker, PDF.js, LibreOffice, Tesseract OCR


https://github.com/Stirling-Tools/Stirling-PDF

https://www.stirlingpdf.com/

https://stirlingpdf.io/

#URL #Tool #GitHub #PDF GitHub - Stirling-Tools/Stirling-PDF: #1 PDF Application on GitHub that lets you edit PDFs on any device anywhere
章快图

一款便捷的免费在线工具,专为PDF文档的电子盖章需求设计,支持普通印章和骑缝章的快速添加。用户无需下载任何软件,即可通过网页直接上传PDF文件并完成盖章操作,满足各类文档处理需求。无论是普通印章还是复杂的骑缝章,章快图都能高效处理,帮助用户轻松实现PDF文档的电子化盖章,适用于合同、协议等文件的快速处理场景。

https://zhang.kuaitu.cc

#PDF #Tool #Image #URL
 
 
Back to Top
OKHK