Skip to main content

OKHK 👀

Thinking ❤️
  1. PDF Craft

    https://github.com/oomol-lab/pdf-craft

    PDF Craft 是一个可以将 PDF 文件转换为各种其他格式的项目。

    该项目主要专注于处理扫描书籍的 PDF 文件。

    1. 可以逐页读取 PDF 页面,并使用 DocLayout-YOLO 结合自编算法提取书籍页面的文本,并过滤掉页眉、页脚、脚注和页码等元素。
    2. 在跨页处理过程中,算法会用于正确处理前后页之间的连接问题,最终生成语义连贯的文本。
    3. 使用 OnnxOCR 进行文本识别,并使用 layoutreader 确定符合人类习惯的阅读顺序。
    4. 仅使用可在本地执行的 AI 模型(使用本地图形设备加速),即可将 PDF 文件转换为 Markdown 格式。
    5. 对于超过 100 页的书籍,建议转换为 EPUB 格式文件。在转换过程中,该库会将本地 OCR 识别的数据传递给 LLM,并通过特定信息(如目录等)构建书籍结构,最终生成带有目录和章节的 EPUB 文件。

    #PDF #Tool #GitHub #AI GitHub - oomol-lab/pdf-craft: PDF craft can convert PDF files into various other formats. This project will focus on processing…
  2. MarkPDFDown - PDF 转 Markdown 工具

    https://github.com/MarkPDFdown/markpdfdown

    MarkPDFDown 是一款强大的工具,它利用 AI 多模态大型语言模型将 PDF 文件转录为 Markdown 格式。

    该工具可以准确地提取文本,保留格式,并处理包括表格、公式和图表在内的复杂文档结构。

    PDF 转 Markdown 转换:将任何 PDF 文档转换为格式良好的 Markdown
    图像转 Markdown 转换:将图像转换为格式良好的 Markdown
    多模态理解:利用 AI 理解文档结构和内容
    格式保留:保留标题、列表、表格和其他格式元素
    可定制模型:可根据需求配置模型

    #PDF #Tool #GitHub #AI GitHub - MarkPDFdown/markpdfdown: A high-quality PDF to Markdown tool based on large language model visual recognition. 一款基于大模…
  3. NetBird - 开源组网工具

    类似 Zerotier、Tailscale 的开源组网工具

    https://github.com/netbirdio/netbird

    https://netbird.io/

    NetBird 是一个开源的网络安全平台,它结合了无需配置的点对点私有网络和集中式访问控制系统,使您的组织或家庭轻松创建安全的私有网络。

    连接性:NetBird 基于 WireGuard 创建一个覆盖网络,自动连接您的设备,无需处理端口开放、复杂的防火墙规则、VPN 网关等问题。
    安全性:NetBird 通过应用细粒度的访问策略,实现安全的远程访问,并提供直观的统一管理界面。
    自动化:NetBird 支持公共 API、IdP 集成、设备状态检查等功能,帮助您自动化网络管理。
    多平台支持:NetBird 支持 Linux、macOS、Windows、Android、iOS 等主流操作系统。

    #Network #Tool #GitHub GitHub - netbirdio/netbird: Connect your devices into a secure WireGuard®-based overlay network with SSO, MFA and granular access…
  4. TaleStreamAI - AI小说推文全自动工作流

    https://github.com/Mubashir-414/TaleStreamAI

    TaleStreamAI是一个基于AI的自动化工作流程,可以将AI生成的小说片段转换为引人入胜的视频内容,用于社交媒体分享。

    1. 完全自动化的工作流程:消除了创建视频内容的手工劳动,利用AI算法实现整个过程的自动化。
    2. AI小说推文提取:自动提取AI模型生成的小说推文,作为视频内容的基础。
    3. 视频创作:利用AI技术,将小说片段转换为视觉吸引力的视频,可以在各种社交媒体平台上分享。
    4. 效率和创新:结合AI能力和讲故事,TaleStreamAI推动了内容创作和分发的边界。

    #AI #Video #Tool #GitHub
  5. 一觉醒来发生了什么 05月03日

    2025年5月3日
    🌍资讯快读
    1、全红婵/陈芋汐夺得跳水世界杯总决赛女子双人10米台冠军
    https://www.jiemian.com/article/12735306.html
    2、泰国报告一例人类感染炭疽死亡病例
    https://www.jiemian.com/article/12735681.html
    3、我国首个少数民族非遗纺织类国标正式实施
    https://www.jiemian.com/article/12735296.html
    4、特朗普称将禁止伊朗石油买家与美国做生意
    https://www.jiemian.com/article/12734674.html

    👬即刻镇小报
    1、如果假期要学AI,可以先看这个视频
    https://m.okjike.com/originalPosts/681244c478711a78e04a2e38
    2、懒人必备!把文字变成播客的神器来了
    https://m.okjike.com/originalPosts/681242b3dc6b6d4853b26bc9
    3、拍了一个短短的纪录片,再一次感受到上海的美
    https://m.okjike.com/originalPosts/68122d1c9f9979a85a03014e
    4、个人信息漏斗价值评价
    https://m.okjike.com/originalPosts/68122789070109da49338cdc

    今日即刻镇小报内容来自 @TomXu @看见节点 @Norah是诺拉 @季森Jason. ,感谢以上即友的创作与分享。
  6. #Bing_Wallpaper

    "犹他州美国拱门国家公园内,一座宏伟的天然砂岩拱门框住了令人叹为观止的银河,这是一个夜晚的沙漠景观和宇宙奇观。拱门边缘柔和的金色光芒映照着石头的纹理,与深靛蓝和漆黑色调的繁星点点夜空形成鲜明对比。一场灿烂的星辰爆发和银河云照亮了整个画面,如同一副天体的锦缎。远处岩层的轮廓在地平线上若隐若现,于超现实的宇宙壮丽中增添了几分厚重感。画面呈现超精细的纹理、生动的自然色彩、富有氛围感的光线效果,将自然与宇宙完美融合,具备超真实主义质感并带有些许超凡脱俗的艺术气息。"
  7. mazanoke - 本地优先的图片压缩工具

    https://mazanoke.com/

    https://github.com/civilblur/mazanoke

    MAZANOKE是一个在浏览器中运行的自托管本地图像优化器。它可以在不离开设备的情况下优化图像,并保护用户的隐私,无需联网可离线使用。

    部署简单、功能丰富,提供图片压缩、格式转换和批量上传等功能,兼容 JPG、PNG、WebP、HEIC、AVIF、GIF、SVG 等图片格式。

    #Image #Tool #GitHub
  8. AI 水印移除工具 - WatermarkRemover-AI

    https://github.com/D-Ogi/WatermarkRemover-AI

    WatermarkRemover-AI 是一款利用 AI 模型进行精准水印检测和无缝去除的先进应用程序。

    它使用 Microsoft 的 Florence-2 进行水印识别,并使用 LaMA 进行修复,以自然地填充被移除的区域。

    该软件提供命令行界面 (CLI) 和基于 PyQt6 的图形用户界面 (GUI),使其能够满足普通用户和高级用户的需求。

    支持多图批量处理:支持单张图片或整个文件夹批量去水印
    提供精准水印识别:基于微软Florence-2视觉大模型,可识别各种样式水印
    上下文感知修复:使用 LaMa inpainting 模型,实现“原图级”上下文感知图像填补
    灵活配置支持:可设置水印最大尺寸、透明度灵敏度,适配不同图片
    多格式输出:支持导出为 .png / .webp / .jpg
    GUI + 命令行双模式:提供图形界面操作和 CLI 脚本
    无需 GPU 支持:在普通笔记本也能流畅运行,轻量级推理

    #AI #Image #Tool #GitHub GitHub - D-Ogi/WatermarkRemover-AI: AI-Powered Watermark Remover using Florence-2 and LaMA: Remove watermarks from images and videos…
OKHK