OKHK 👀
✨ Thinking ❤️
-
- PDF Craft
https://github.com/oomol-lab/pdf-craft
PDF Craft 是一个可以将 PDF 文件转换为各种其他格式的项目。
该项目主要专注于处理扫描书籍的 PDF 文件。
1. 可以逐页读取 PDF 页面,并使用 DocLayout-YOLO 结合自编算法提取书籍页面的文本,并过滤掉页眉、页脚、脚注和页码等元素。
2. 在跨页处理过程中,算法会用于正确处理前后页之间的连接问题,最终生成语义连贯的文本。
3. 使用 OnnxOCR 进行文本识别,并使用 layoutreader 确定符合人类习惯的阅读顺序。
4. 仅使用可在本地执行的 AI 模型(使用本地图形设备加速),即可将 PDF 文件转换为 Markdown 格式。
5. 对于超过 100 页的书籍,建议转换为 EPUB 格式文件。在转换过程中,该库会将本地 OCR 识别的数据传递给 LLM,并通过特定信息(如目录等)构建书籍结构,最终生成带有目录和章节的 EPUB 文件。
#PDF #Tool #GitHub #AI - MarkPDFDown - PDF 转 Markdown 工具
https://github.com/MarkPDFdown/markpdfdown
MarkPDFDown 是一款强大的工具,它利用 AI 多模态大型语言模型将 PDF 文件转录为 Markdown 格式。
该工具可以准确地提取文本,保留格式,并处理包括表格、公式和图表在内的复杂文档结构。
● PDF 转 Markdown 转换:将任何 PDF 文档转换为格式良好的 Markdown
● 图像转 Markdown 转换:将图像转换为格式良好的 Markdown
● 多模态理解:利用 AI 理解文档结构和内容
● 格式保留:保留标题、列表、表格和其他格式元素
● 可定制模型:可根据需求配置模型
#PDF #Tool #GitHub #AI - NetBird - 开源组网工具
类似 Zerotier、Tailscale 的开源组网工具
https://github.com/netbirdio/netbird
https://netbird.io/
NetBird 是一个开源的网络安全平台,它结合了无需配置的点对点私有网络和集中式访问控制系统,使您的组织或家庭轻松创建安全的私有网络。
● 连接性:NetBird 基于 WireGuard 创建一个覆盖网络,自动连接您的设备,无需处理端口开放、复杂的防火墙规则、VPN 网关等问题。
● 安全性:NetBird 通过应用细粒度的访问策略,实现安全的远程访问,并提供直观的统一管理界面。
● 自动化:NetBird 支持公共 API、IdP 集成、设备状态检查等功能,帮助您自动化网络管理。
● 多平台支持:NetBird 支持 Linux、macOS、Windows、Android、iOS 等主流操作系统。
#Network #Tool #GitHub - TaleStreamAI - AI小说推文全自动工作流
https://github.com/Mubashir-414/TaleStreamAI
TaleStreamAI是一个基于AI的自动化工作流程,可以将AI生成的小说片段转换为引人入胜的视频内容,用于社交媒体分享。
1. 完全自动化的工作流程:消除了创建视频内容的手工劳动,利用AI算法实现整个过程的自动化。
2. AI小说推文提取:自动提取AI模型生成的小说推文,作为视频内容的基础。
3. 视频创作:利用AI技术,将小说片段转换为视觉吸引力的视频,可以在各种社交媒体平台上分享。
4. 效率和创新:结合AI能力和讲故事,TaleStreamAI推动了内容创作和分发的边界。
#AI #Video #Tool #GitHub - Hacker Laws
https://hacker-laws.com/
https://github.com/dwmkerr/hacker-laws
一个针对开发人员的参考指南,列举了各种在软件开发中常见的法则、原则和模式。
这些法则和原则提供了对软件工程中一些不可避免的现实和挑战的见解。
详细介绍了多个著名的理论和法则,如90-9-1原则、Amdahl定律、布鲁克斯定律、CAP定理等。
#GitHub #Doc #DevOps -
- 一觉醒来发生了什么 05月03日
2025年5月3日
🌍资讯快读
1、全红婵/陈芋汐夺得跳水世界杯总决赛女子双人10米台冠军
https://www.jiemian.com/article/12735306.html
2、泰国报告一例人类感染炭疽死亡病例
https://www.jiemian.com/article/12735681.html
3、我国首个少数民族非遗纺织类国标正式实施
https://www.jiemian.com/article/12735296.html
4、特朗普称将禁止伊朗石油买家与美国做生意
https://www.jiemian.com/article/12734674.html
👬即刻镇小报
1、如果假期要学AI,可以先看这个视频
https://m.okjike.com/originalPosts/681244c478711a78e04a2e38
2、懒人必备!把文字变成播客的神器来了
https://m.okjike.com/originalPosts/681242b3dc6b6d4853b26bc9
3、拍了一个短短的纪录片,再一次感受到上海的美
https://m.okjike.com/originalPosts/68122d1c9f9979a85a03014e
4、个人信息漏斗价值评价
https://m.okjike.com/originalPosts/68122789070109da49338cdc
今日即刻镇小报内容来自 @TomXu @看见节点 @Norah是诺拉 @季森Jason. ,感谢以上即友的创作与分享。 -
-
- mazanoke - 本地优先的图片压缩工具
https://mazanoke.com/
https://github.com/civilblur/mazanoke
MAZANOKE是一个在浏览器中运行的自托管本地图像优化器。它可以在不离开设备的情况下优化图像,并保护用户的隐私,无需联网可离线使用。
部署简单、功能丰富,提供图片压缩、格式转换和批量上传等功能,兼容 JPG、PNG、WebP、HEIC、AVIF、GIF、SVG 等图片格式。
#Image #Tool #GitHub - AI 水印移除工具 - WatermarkRemover-AI
https://github.com/D-Ogi/WatermarkRemover-AI
WatermarkRemover-AI 是一款利用 AI 模型进行精准水印检测和无缝去除的先进应用程序。
它使用 Microsoft 的 Florence-2 进行水印识别,并使用 LaMA 进行修复,以自然地填充被移除的区域。
该软件提供命令行界面 (CLI) 和基于 PyQt6 的图形用户界面 (GUI),使其能够满足普通用户和高级用户的需求。
● 支持多图批量处理:支持单张图片或整个文件夹批量去水印
● 提供精准水印识别:基于微软Florence-2视觉大模型,可识别各种样式水印
● 上下文感知修复:使用 LaMa inpainting 模型,实现“原图级”上下文感知图像填补
● 灵活配置支持:可设置水印最大尺寸、透明度灵敏度,适配不同图片
● 多格式输出:支持导出为 .png / .webp / .jpg
● GUI + 命令行双模式:提供图形界面操作和 CLI 脚本
● 无需 GPU 支持:在普通笔记本也能流畅运行,轻量级推理
#AI #Image #Tool #GitHub -