Skip to main content

OKHK 👀

Thinking...
❤️ PM:https://t.me/iokhk?direct
  1. Pix2Text - 开源多功能图像内容识别工具

    https://github.com/breezedeus/Pix2Text

    一款开源 Python3 工具,可以识别图片中的版面、表格、图片、文字、数学公式等内容,并整合所有内容后以 Markdown 格式输出。

    它是 Mathpix 的免费替代品,可将视觉内容无缝转换为基于文本的表述,支持 80 多种语言。

    P2T 也可以把一整个 PDF 文件(PDF 的内容可以是扫描图片或者其他任何格式)转换为 Markdown 格式。

    网页版每人每天可以免费识别 10000 个字符,正常使用应该够用了。

    在线体验:https://huggingface.co/spaces/breezedeus/Pix2Text-Demo

    网站版本:https://p2t.breezedeus.com/

    相关

    Pix2Text-Mac - 识别数学公式的 Mac 桌面版应用

    CnOCR - 基于 PyTorch/MXNet 的中文/英文 OCR Python 包

    CnSTD - 基于 PyTorch/MXNet 的 中文/英文 场景文字、数学公式检测、篇章分析的 Python3 包

    #OCR #Image #Tool #GitHub
  2. #macOS #Tool #AI #RePost

    Impel:比 Siri 更智能的 macOS AI 助理

    🔗 Web

    ℹ️ 关于 Impel

    由 Impel 团队推出的一款 AI 助理 App,它始终在线,无需任何提示,常驻后台学习你的使用习惯及操作流程,并在需要时给予帮助;
    目前完全免费使用。「Impel 是你在 Mac 上时刻在线的 AI 伴侣,它能理解你屏幕上的信息,不需要任何的提示词就能自动地提供建议、信息和操作」;
    需要开启录屏与系统录音、麦克风等访问权限,对此 Impel 表示所有数据都在本地存储、提取和处理。

    功能亮点

    无需任何操作,智能询问你是否需要总结当前浏览器页面的视频、文章等内容;
    借助 Private Tutor 功能,使用自然语言针对博客文章、文档、视频等内容提问;
    支持连接 Notion、Dropbox、OneDrive 等平台,搜索并根据文档内容回答问题;
    除此之外,你也能够直接在 Imepl 中上传文件或粘贴链接以生成摘要、全局搜索等功能;

    👀 我的看法

    在 Impel 的预热推文中,他们提到「让我们面对现实吧:目前那些 AI 助手都糟透了。你得中断自己的节奏,写下具体的提示,然后等待一个也许没有什么用的答案」——相信这也是过去一年来,我们使用 AI 的感受,它确实强大,但却不够智能,就像一头不懂得「察言观色」的初生牛犊,你抽它一鞭,它才走一步。

    与之相比,Impel 则像是游刃有余的高级助理,给予相关访问权限后,它便常驻后台持续学习你的使用习惯及操作流程,在你需要时才递上一杯热茶、或者一声问候。比如,它会在你消费内容时贴心地询问你是否需要总结,在你登录账号时为你截取验证码(暂未推出),理想情况下,它就像是 Siri 的完全体,符合你对未来世界的所有想象:为你生成内容、发送提醒、预订航班、回复邮件等等,而这一切,都不需要你开口。

    📁 本文首发于 Humanitech 频道,图文版见 小红书

    Message link
OKHK