OKHK 🐟

✨ 随机碎片 / 资讯文档 / 网站工具 / GitHub 项目 / Bing 壁纸

12:16 · 2026年2月13日 · 周五

https://github.com/zhihuiyuze/PDF-Prompt-Injection-Toolkit
一个用于测试和检测 PDF 文档中隐藏的提示词注入攻击的红蓝对抗工具包。
#PDF #AI #Tool

GitHub - zhihuiyuze/PDF-Prompt-Injection-Toolkit: A red team / blue team toolkit for testing and detecting prompt injection attacks…

A red team / blue team toolkit for testing and detecting prompt injection attacks hidden inside PDF documents. 一个用于测试和检测 PDF 文档中隐藏的提示词注入攻击的红蓝对抗工具包。 - zhihuiyuze/PDF-Prompt-Injection-Toolkit

PDF AI Tool

15:05 · 2026年1月4日 · 周日

BentoPDF - 开源 PDF 工具集合

https://github.com/alam00000/bentopdf

BentoPDF 是一个注重隐私的开源 PDF 工具集合，所有处理都在客户端浏览器中进行，无需服务器处理。

项目提供超过 50 种 PDF 操作工具，覆盖编辑、转换、安全、优化等多个维度。

● PDF 组织管理：合并、分割、重新排序、提取、删除、旋转页面，支持拖放操作
● PDF 编辑修改：PDF 编辑器、创建可填充表单、添加页码、水印、页眉页脚等
● 格式转换：图片转 PDF（JPG/PNG/WebP/SVG 等）、Markdown/ 文本 /EPUB 转 PDF、PDF 转图片 /JSON/ 灰度等
● 安全优化：压缩、修复、加密 / 解密、数字签名、去除元数据、内容编辑等
● OCR 识别：使光学字符识别使扫描 PDF 可搜索
● 高级功能：PDF 比较、添加附件、OCR、数字签名等 50+ 工具
● 易于使用与部署：支持多种方式进行本地运行和自行托管，包括 Docker 和静态文件部署
● 技术栈现代：基于 Vite、TypeScript 和 Tailwind CSS 构建，性能优越且易于维护

#PDF #Tool #GitHub

相关： https://github.com/Stirling-Tools/Stirling-PDF

GitHub

GitHub - alam00000/bentopdf: A Privacy First PDF Toolkit

A Privacy First PDF Toolkit. Contribute to alam00000/bentopdf development by creating an account on GitHub.

PDF Tool GitHub

15:36 · 2025年11月2日 · 周日

OKHK 🐟

Stirling-PDF 一个强大的、本地托管的基于 Web 的 PDF 操作工具,使用 Docker 构建。它可以执行各种 PDF 文件操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等。这个可本地私有部署的 Web 应用程序已经发展成为一个全面的功能集,满足所有 PDF 需求。 ● 50 多种 PDF 操作 ● 并行文件处理和下载 ● 暗模式支持 ● 自定义下载选项 ● 自定义"管道"以自动化队列运行多个功能 ● 与外部脚本集成的 API ● 可选的登录和身份验证支持 ● 数据库备份和导入…

PDF 补丁丁（PDFPatcher） - PDF 处理工具

https://github.com/wmjordan/PDFPatcher

PDF 工具箱，可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档，探查文档结构，提取图片、转成图片等等

#PDF #Tool #GitHub

GitHub

GitHub - wmjordan/PDFPatcher: PDF补丁丁——PDF工具箱，可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档，探查文档结构，提取图片、转成图片等等

PDF补丁丁——PDF工具箱，可以编辑书签、剪裁旋转页面、解除限制、提取或合并文档，探查文档结构，提取图片、转成图片等等 - wmjordan/PDFPatcher

PDF Tool GitHub

18:56 · 2025年10月20日 · 周一

Scribe OCR - 对图片 / PDF 文件进行 OCR 数字化校对

https://scribeocr.com/

https://github.com/scribeocr/scribeocr

Scribe OCR 是一款免费的 Web 应用，可以当作 Adobe Acrobat 等应用的简单替代品。

专注于图像文本识别、高效 OCR 数据校对及创建完全数字化的原生文本文档，能够将扫描内容转换为准确、可搜索且可编辑的数字格式，包括电子书风格的 PDF 文档。

● 免费的网页端文本识别、OCR 校对及文档数字化应用。
● 完全基于浏览器客户端运行，确保数据隐私安全。
● 通过优化文本叠加和定制字体生成，实现精准校对。

#OCR #Image #PDF #Tool #GitHub

GitHub

GitHub - scribeocr/scribeocr: Web interface for recognizing text, proofreading OCR, and creating fully-digitized documents.

Web interface for recognizing text, proofreading OCR, and creating fully-digitized documents. - GitHub - scribeocr/scribeocr: Web interface for recognizing text, proofreading OCR, and creating ful...

OCR Image PDF Tool GitHub

17:52 · 2025年10月5日 · 周日

surya - 开源文档 OCR 工具包

https://github.com/VikParuchuri/surya

Surya 是一个开源的文档 OCR 工具包

● 90 多种语言的 OCR，性能优于云服务
● 适用于各种文档，包括图像、PDF、Word 文档和 PowerPoint 演示文稿（PPT）
● 行级文本检测，版面布局分析（表格、图像、页眉、等检测）
● 阅读顺序检测
● 表格识别（检测行 / 列）
● LaTeX OCR

#OCR #Doc #Image #PDF #Tool #GitHub

GitHub

GitHub - datalab-to/surya: OCR, layout analysis, reading order, table recognition in 90+ languages

OCR, layout analysis, reading order, table recognition in 90+ languages - datalab-to/surya

OCR Doc Image PDF Tool GitHub

14:54 · 2025年9月24日 · 周三

PDFQFZ - PDF 文件加盖骑缝章工具

https://github.com/flytkgl/PDFQFZ)

PDFQFZ 是一个 PDF 加盖骑缝章的小工具。

用户选择需要盖章的 PDF 文件或文件夹，导入完整的印章图片，并根据 PDF 页数自动分割印章。

可以设定印章大小、骑缝章位置和印章位置等参数，点击 " 盖章 " 后即可在保存文件夹中看到盖好骑缝章的 PDF 文件。

#PDF #Tool #GitHub

PDF Tool GitHub

18:24 · 2025年8月16日 · 周六

Marker - 将 PDF 快速转换为 Markdown / JSON / HTML

https://github.com/datalab-to/marker

API 版本： https://github.com/adithya-s-k/marker-api

Marker 是一个将 PDF 文档转换为 Markdown、JSON 和 HTML 的工具，快速准确。

● 支持多种文件格式（PDF、图像、PPTX、DOCX、XLSX、HTML、EPUB）和多种语言的转换
● 格式化表格、公式、内联数学、链接、引用和代码块
● 提取和保存图像，移除页眉 / 页脚等
● 可通过 LLM 提高转换准确度

#PDF #Tool #GitHub

GitHub

GitHub - datalab-to/marker: Convert PDF to markdown + JSON quickly with high accuracy

Convert PDF to markdown + JSON quickly with high accuracy - datalab-to/marker

PDF Tool GitHub

16:35 · 2025年7月1日 · 周二

invoicely - 发票（商业账单 / 凭证）生成平台

https://github.com/legions-developer/invoicely

https://invoicely.gg

Invoicely 是一个基于 Next.js、tRPC 和 TypeScript 构建的现代化、开源的发票生成平台。

项目提供了一个简单易用的界面，用户可以在几分钟内创建专业的发票。

● 基于 Next.js 的现代化 Web 应用程序
● 使用 tRPC 实现端到端的类型安全 API
● 采用 TypeScript 进行类型安全开发
● 集成 Drizzle ORM 进行数据库操作
● 支持 Cloudflare R2 进行文件存储
● 提供 Google OAuth 社交登录功能
● 使用 Zod 进行数据验证
● 集成 PostHog 和 OpenPanel 进行分析和监控

#GitHub #Tool #PDF #Design

GitHub

GitHub - legions-developer/invoicely: Invoicely is a simple and easy to use invoice generator where you can create beautiful and…

Invoicely is a simple and easy to use invoice generator where you can create beautiful and professional invoices in minutes. ~ Proudly OSS - legions-developer/invoicely

GitHub Tool PDF Design

14:19 · 2025年6月25日 · 周三

OfficeViewer - 浏览器查看 Office 文件

https://officeviewer.org/

Office Viewer 提供免费在线文档、CSV 和压缩文件查看服务。无需安装 Office 应用，在浏览器内查看 Office 文件的服务。

● 支持多种常见格式，包括 Word (.docx)、Excel (.xlsx)、PowerPoint (.pptx)、PDF (.pdf)、CSV (.csv)、ZIP (.zip) 和 RAR (.rar)。
● 所有文件处理均在用户浏览器中进行，文件不会上传到服务器，保障用户隐私和安全，无需注册或提供个人信息。
● CSV 文件支持查看、搜索、排序和高级筛选功能。
● 压缩文件支持浏览内容、预览文件和下载单个项目，无需完整解压。
● 采用 Vue.js、Nuxt.js 等现代 Web 技术构建，基于 vue office 项目。

#URL #PDF #Doc #Tool #GitHub

officeviewer.org

Open Word, Excel & PPT Online - Free & Secure Office Viewer

Instantly view Word, Excel, PPT, PDF, and more online for free. Secure, private, and no software to install. Try the easiest document viewer today!

URL PDF Doc Tool GitHub

14:04 · 2025年5月29日 · 周四

免费 PDF 软件

https://www.pdfgear.com/

PDFgear 是一款完全免费的 PDF 软件，提供阅读、编辑、转换、合并和签署 PDF 文件功能，无需注册。

主要功能包括 PDF 文档编辑（文本、图像、签名等）、PDF 注释（高亮、评论等）、PDF 转换（批量高速转换）和 OCR 图文识别（从图像中提取文本，支持多语言）。

除了桌面软件，PDFgear 还提供数十种免费在线工具，用于快速完成 PDF 任务，例如编辑、转换、分割、合并和压缩 PDF。

#URL #Tool #PDF

Pdfgear

PDFgear - Free PDF Editor Software & Online tools

Edit PDF online or offline with PDFgear's free tools and software. Merge, split, convert, and more. Powerful and user-friendly solutions for all your PDF needs.

URL Tool PDF

13:18 · 2025年5月8日 · 周四

免费 PDF 编辑器 - 无需安装，无需上传

https://breezepdf.com

Breeze PDF 是一个强大的免费 PDF 编辑器，可以在浏览器内离线使用，确保用户隐私，不需要上传文件。用户的文件始终保存在本地计算机上，确保数据安全。

● 添加文本：可以轻松在 PDF 文档的任意位置输入和添加文本。
● 添加图片：支持直接在 PDF 页面中插入 JPG 或 PNG 格式的图片。
● 添加签名：允许用户通过绘制、输入或上传的方式进行数字签名。
● 表单字段：可以添加互动文本输入框，制作可填写的表单。
● 合并 PDF：将多个 PDF 文件合并为一个文档。
● 删除页面：轻松移除 PDF 文件中不需要的页面。
● 密码保护：使用强密码加密保护敏感的 PDF 文档。

https://news.ycombinator.com/item?id=43880962

#PDF #Tool #URL #Editor

Best PDF Editor | Edit, Sign, Merge & Secure

Edit PDFs with ease—add text, images, signatures, merge files, create fillable forms, and password protect documents. Try our all-in-one PDF editor now!

PDF Tool URL Editor

14:35 · 2025年5月3日 · 周六

PDF Craft

https://github.com/oomol-lab/pdf-craft

PDF Craft 是一个可以将 PDF 文件转换为各种其他格式的项目。

该项目主要专注于处理扫描书籍的 PDF 文件。

1. 可以逐页读取 PDF 页面,并使用 DocLayout-YOLO 结合自编算法提取书籍页面的文本,并过滤掉页眉、页脚、脚注和页码等元素。
2. 在跨页处理过程中,算法会用于正确处理前后页之间的连接问题,最终生成语义连贯的文本。
3. 使用 OnnxOCR 进行文本识别,并使用 layoutreader 确定符合人类习惯的阅读顺序。
4. 仅使用可在本地执行的 AI 模型(使用本地图形设备加速),即可将 PDF 文件转换为 Markdown 格式。
5. 对于超过 100 页的书籍,建议转换为 EPUB 格式文件。在转换过程中,该库会将本地 OCR 识别的数据传递给 LLM,并通过特定信息(如目录等)构建书籍结构,最终生成带有目录和章节的 EPUB 文件。

#PDF #Tool #GitHub #AI

GitHub

GitHub - oomol-lab/pdf-craft: PDF craft can convert PDF files into various other formats. This project will focus on processing…

PDF craft can convert PDF files into various other formats. This project will focus on processing PDF files of scanned books. - oomol-lab/pdf-craft

PDF Tool GitHub AI

14:13 · 2025年5月3日 · 周六

MarkPDFDown - PDF 转 Markdown 工具

https://github.com/MarkPDFdown/markpdfdown

MarkPDFDown 是一款强大的工具,它利用 AI 多模态大型语言模型将 PDF 文件转录为 Markdown 格式。

该工具可以准确地提取文本,保留格式,并处理包括表格、公式和图表在内的复杂文档结构。

● PDF 转 Markdown 转换:将任何 PDF 文档转换为格式良好的 Markdown
● 图像转 Markdown 转换:将图像转换为格式良好的 Markdown
● 多模态理解:利用 AI 理解文档结构和内容
● 格式保留:保留标题、列表、表格和其他格式元素
● 可定制模型:可根据需求配置模型

#PDF #Tool #GitHub #AI

GitHub

GitHub - MarkPDFdown/markpdfdown: A high-quality PDF to Markdown tool based on large language model visual recognition. 一款基于大模…

A high-quality PDF to Markdown tool based on large language model visual recognition. 一款基于大模型视觉识别的高质量PDF转Markdown工具 - MarkPDFdown/markpdfdown

PDF Tool GitHub AI

14:20 · 2025年5月1日 · 周四

DocTranslator - 文档翻译

免费在线文档翻译服务，支持将办公文档如 Word、PDF、Excel、PowerPoint、 OpenOffice 和文本文件翻译成多种语言，同时完美保留原始排版

只需将文件拖拽上传，系统会自动检测原始语言并将其翻译为目标语言

https://www.onlinedoctranslator.com/zh-CN/translationform#google_vignette

#URL #PDF #Tool

Online Doc Translator

免费在线文档翻译器：PDF, Word, Excel, PPT

免费在线翻译文档。上传 PDF、Word、Excel、PowerPoint 或文本，并保留原始布局。

URL PDF Tool

21:16 · 2025年4月23日 · 周三

OKHK 🐟

BabelDOC 开源 PDF 翻译工具精准保持公式表格排版的学术翻译神器 https://github.com/funstory-ai/BabelDOC https://funstory-ai.github.io/BabelDOC/ BabelDOC 是一个 PDF 科学论文翻译和双语比较库，支持自部署和在线服务。它提供了简单的命令行界面和 Python API，主要设计用于嵌入到其他程序中使用,但也可以直接用于简单的翻译任务。 ● 提供 PDF 文档的解析和渲染功能 ● 支持多种翻译服务…

沉浸式翻译新工具——BabelDOC

https://app.immersivetranslate.com/babel-doc/
#PDF #Tool #URL #AI

支持在翻译 PDF 的时候保持文件的原始排版，而且还能完整提取 PDF 内嵌的图表、脚注、公式等⾮⽂本元素。

Telegraph

沉浸式翻译再发神器，PDF翻译终极解决方案，重要的是依然良心

沉浸式翻译我相信只要是 AI 圈子的人基本上人手一个，甚至你如果经常看海外内容不可能没有。他可以用 AI 或者常规翻译生成整个网页的多语言对照翻译，还有连按三下空格将输入框的中文翻译为英文这个神级技能。除了体验很好之外还非常良心，免费提供几乎无限量的谷歌翻译额度，而且几乎适配了所有的模型 API，你可以随意填写自己的。然后前几天我发现他们发了个新功能：Babeldoc，支持在翻译 PDF 的时候保持文件的原始排版，而且还能完整提取 PDF 内嵌的图表、脚注、公式等⾮⽂本元素。刚开始我是不信的，过…

PDF Tool URL AI

10:18 · 2025年4月14日 · 周一

MinerU - PDF 转换 Markdown / JSON 工具

https://github.com/opendatalab/MinerU

MinerU 是一个高质量的 PDF 内容提取工具包,可将 PDF 文档转换为可读格式(如 Markdown、JSON),方便进一步处理和分析。

它专注于解决科技文献中的符号转换问题,为大模型时代的技术发展做出贡献。与知名商业产品相比,MinerU 还在不断完善和优化中。

● 移除页眉、页脚、脚注、页码等,确保语义连贯性
● 按阅读顺序输出文本,适用于单栏、多栏和复杂布局
● 保留原文档的结构,包括标题、段落、列表等
● 提取图像、图像描述、表格、表格标题和脚注
● 自动识别并转换文档中的公式为 LaTeX 格式
● 自动识别并转换文档中的表格为 HTML 格式
● 自动检测扫描 PDF 和乱码 PDF,并启用 OCR 功能
● OCR 支持 84 种语言的检测和识别
● 支持多种输出格式,如多模态 Markdown、按阅读顺序排序的 JSON,以及丰富的中间格式

#PDF #Tool #GitHub

GitHub

GitHub - opendatalab/MinerU: Transforms complex documents like PDFs into LLM-ready markdown/JSON for your Agentic workflows.

Transforms complex documents like PDFs into LLM-ready markdown/JSON for your Agentic workflows. - opendatalab/MinerU

PDF Tool GitHub

21:39 · 2025年4月10日 · 周四

BabelDOC 开源 PDF 翻译工具精准保持公式表格排版的学术翻译神器

https://github.com/funstory-ai/BabelDOC

https://funstory-ai.github.io/BabelDOC/

BabelDOC 是一个 PDF 科学论文翻译和双语比较库，支持自部署和在线服务。

它提供了简单的命令行界面和 Python API，主要设计用于嵌入到其他程序中使用,但也可以直接用于简单的翻译任务。

● 提供 PDF 文档的解析和渲染功能
● 支持多种翻译服务,如 OpenAI
● 支持双语 PDF 输出
● 提供离线资产管理功能

#GitHub #PDF #Tool

GitHub

GitHub - funstory-ai/BabelDOC: Yet Another Document Translator

Yet Another Document Translator. Contribute to funstory-ai/BabelDOC development by creating an account on GitHub.

GitHub PDF Tool

19:07 · 2025年4月2日 · 周三

DeepPDF：AI翻译PDF并保持原版排版

DeepPDF 支持 PDF 翻译、对话、总结。

AI翻译PDF并保持原版排版，支持最大 200MB PDF 文件

https://deeppdf.ai/pdf-translator

#URL #AI #PDF #Tool

deeppdf.ai

AI PDF Translator - Translate PDFs Online Free, No Sign-up

Translate long PDFs with AI PDF Translator on DeepPDF, offering a side-by-side bilingual view and support for 100+ languages.

URL AI PDF Tool

20:47 · 2025年3月13日 · 周四

Stirling-PDF

一个强大的、本地托管的基于 Web 的 PDF 操作工具,使用 Docker 构建。

它可以执行各种 PDF 文件操作,包括拆分、合并、转换、重组、添加图像、旋转、压缩等。

这个可本地私有部署的 Web 应用程序已经发展成为一个全面的功能集,满足所有 PDF 需求。

● 50 多种 PDF 操作
● 并行文件处理和下载
● 暗模式支持
● 自定义下载选项
● 自定义"管道"以自动化队列运行多个功能
● 与外部脚本集成的 API
● 可选的登录和身份验证支持
● 数据库备份和导入
● 企业级功能,如单点登录

Java, Docker, PDF.js, LibreOffice, Tesseract OCR

● https://github.com/Stirling-Tools/Stirling-PDF

● https://www.stirlingpdf.com/

● https://stirlingpdf.io/

#URL #Tool #GitHub #PDF

GitHub

GitHub - Stirling-Tools/Stirling-PDF: #1 PDF Application on GitHub that lets you edit PDFs on any device anywhere

#1 PDF Application on GitHub that lets you edit PDFs on any device anywhere - Stirling-Tools/Stirling-PDF

URL Tool GitHub PDF

17:05 · 2025年2月21日 · 周五

章快图

一款便捷的免费在线工具，专为PDF文档的电子盖章需求设计，支持普通印章和骑缝章的快速添加。用户无需下载任何软件，即可通过网页直接上传PDF文件并完成盖章操作，满足各类文档处理需求。无论是普通印章还是复杂的骑缝章，章快图都能高效处理，帮助用户轻松实现PDF文档的电子化盖章，适用于合同、协议等文件的快速处理场景。

https://zhang.kuaitu.cc

#PDF #Tool #Image #URL

章快图

章快图 - 免费在线PDF盖章工具

章快图提供免费在线PDF盖章服务，在线盖骑缝章，支持添加普通印章和骑缝章，无需下载软件即可完成PDF文档盖章

PDF Tool Image URL

Home