Skip to main content

OKHK 👀

随机碎片 / 资讯文档 / 网站工具 / GitHub 项目 / Bing 壁纸
  1. 鉴于当前各大 LLM 逐步普及以零宽字符为代表的文本隐写水印手段,为此我特地写了一个小工具,专门用于扫描文本中的隐蔽 / 不可见 Unicode 码点,便于快速定位可能存在的 「文本水印」。

    目前可检测的特殊 Unicode 码点与类别如下 (包括但不限于):

    - ZWSP: 零宽空格
    - ZWNJ: 零宽非连字
    - ZWJ: 零宽连字
    - BOM: 字节序标记
    - WJ: 单词连接符
    - MVS: 蒙古元音分隔符
    - SHY: 软连字符

    除字符扫描外,还支持基于 cl100k_base (GPT-4) & o200k_base (GPT-4o) BPE Tokenization 进行分词,便于辅助判定

    快速体验: https://links.xmsl.dev/analyzer 欢迎反馈

    示例文本 (内含隐写水印):

    ZWSP: Lorem​Ipsum​Dolor
    ZWNJ: Hello‌World
    ZWJ: Foo‍Bar
    BOM: StartOfText
    WJ: Alpha⁠Beta
    MVS: First᠎Second

    From
  2. 一觉醒来发生了什么 08 月 17

    2025 年 8 月 17 日
    🌍 资讯快读
    1、官方通报女司机亮证逼迫让路事件后续处理结果
    https://www.jiemian.com/article/13188223.html
    2、上海临港首批无人驾驶智能网联出租车正式开放运营
    https://36kr.com/newsflashes/3425106722704769
    3、山东荣成一载 11 人面包车坠海,已致 6 人遇难
    https://www.thepaper.cn/newsDetail_forward_31412794
    4、特朗普建议泽连斯基尽快达成协议
    https://www.jiemian.com/article/13187956.html
    5、胖东来:小时工标准时薪 30-40 元 每日工作 4 小时
    https://36kr.com/newsflashes/3425059977334150

    👬 即刻镇小报
    1、如果 AI 不能继续变聪明了,我们该怎么办
    https://m.okjike.com/originalPosts/689dfa2e2469d01c095b2a24
    2、人生太短暂,不应为愚蠢的事情担心
    https://m.okjike.com/originalPosts/689d6930f00fd49661a54ff4
    3、理性的本质是尊重常识和规律,勤于思考、总结、比较,较真
    https://m.okjike.com/originalPosts/689e0e03af9cf6d060fcd986
    4、藏居星空~
    https://m.okjike.com/originalPosts/689d4a24acee2860be3ef14d

    今日即刻镇小报内容来自 @阑夕 ོ @Szhans @郑立涛 @隔壁老劉 ,感谢以上即友的创作与分享。
  3. WRKFLW - GitHub Actions 本地调试验证工具

    https://github.com/bahdotsh/wrkflw

    WRKFLW 是一个在本地验证和执行 GitHub Actions 工作流程的命令行工具。

    无需完整的 GitHub 环境,直接在本地机器上测试 Action 的工作流程。

    ----------------------

    之前看到act 类似,暂未详细对比

    #GitHub #Tool #Shell #Docker #DevOps GitHub - bahdotsh/wrkflw: Validate and Run GitHub Actions locally.
  4. Klic Studio - 音视频处理工具(翻译 / 配音 )

    https://github.com/krillinai/KlicStudio

    多平台发布 / 搬运视频好帮手

    Klic Studio 是由 Krillin AI 开发的多功能音视频本地化和增强解决方案。

    集成了视频翻译、配音和语音克隆,支持横屏和竖屏格式,确保在所有主要平台(Bilibili、小红书、抖音、微信视频、快手、YouTube、TikTok 等)上完美呈现。

    通过端到端的工作流程,您只需几次点击即可将原材料转化为精美的跨平台内容。

    视频获取:支持 yt-dlp 下载或本地文件上传
    准确识别:基于 Whisper 的高精度语音识别
    智能分段:使用 LLM 进行字幕分段和对齐
    术语替换:一键替换专业词汇
    专业翻译:基于上下文的 LLM 翻译,保持自然语义
    语音克隆:提供 CosyVoice 中选择的语音音调或自定义语音克隆
    视频合成:自动处理横屏和竖屏视频及字幕布局
    跨平台:支持 Windows、Linux、macOS,提供桌面和服务器版本

    #Video #Voice #Tool #GitHub GitHub - krillinai/KrillinAI: Video translation and dubbing tool powered by LLMs. The video translator offers 100 language translations…
  5. Marker - 将 PDF 快速转换为 Markdown / JSON / HTML

    https://github.com/datalab-to/marker

    API 版本: https://github.com/adithya-s-k/marker-api

    Marker 是一个将 PDF 文档转换为 Markdown、JSON 和 HTML 的工具,快速准确。

    支持多种文件格式(PDF、图像、PPTX、DOCX、XLSX、HTML、EPUB)和多种语言的转换
    格式化表格、公式、内联数学、链接、引用和代码块
    提取和保存图像,移除页眉 / 页脚等
    可通过 LLM 提高转换准确度

    #PDF #Tool #GitHub GitHub - datalab-to/marker: Convert PDF to markdown + JSON quickly with high accuracy
  6. urldb - 网盘资源数据库

    https://github.com/ctwj/urldb

    一个现代化的网盘资源数据库,支持多网盘自动化转存分享,支持百度网盘,阿里云盘,夸克网盘, 天翼云盘,迅雷云盘,123 云盘,115 网盘,UC 网盘

    公开 API - 支持 API 数据录入,资源搜索
    自动预处理 - 系统自动处理资源, 对数据进行有效性判断
    自动转存分享 - 有效资源,如果属于支持类型将自动转存分享
    多账号管理 - 同平台支持多账号管理

    #GitHub #Tool
  7. 中文敏感词库

    “敏感肌”自我审查

    https://github.com/konsheng/Sensitive-lexicon

    一个中文敏感词库,帮助开发者和内容审核者快速识别并过滤不当文本。

    提供了一份广泛覆盖政治、色情、暴力等敏感领域的词汇列表,方便快速嵌入任何文本审核流程
    纯文本格式,兼容任意编程语言和框架,支持多种过滤算法(DFA、Trie、正则等)快速集成

    #GitHub GitHub - konsheng/Sensitive-lexicon: 一个持续更新的中文敏感词库,帮助开发者和内容审核者快速识别并过滤不当文本,即将迎来重大更新。
  8. 一觉醒来发生了什么 08 月 16

    2025 年 8 月 16 日
    🌍 资讯快读
    1、国家卫生健康委调查组通报肖某董某莹事件调查处置及问责情况
    https://www.jiemian.com/article/13185514.html
    2、肇庆怀集客运车起火致 6 死事故调查报告
    https://www.thepaper.cn/newsDetail_forward_31404604
    3、全球首个人形机器人运动会在北京开幕
    https://www.pingwest.com/w/306881
    4、日本战败 80 周年,两任前首相分别表态:“日本需要持续怀有道歉的心情”
    https://www.thepaper.cn/newsDetail_forward_31405236

    👬 即刻镇小报
    1、当越多的人对现实无能为力,短剧也会越流行
    https://m.okjike.com/originalPosts/689c1436e5d1c2f3b1639eef
    2、睡觉是最好的休息方式,没有任何其他方式可以代替
    https://m.okjike.com/originalPosts/689d19334c983add4fbe003c
    3、人只能基于当下的信息,做出当下对自己最有利的选择
    https://m.okjike.com/originalPosts/689d58c4acee2860be401474
    4、大自然的鬼斧神工
    https://m.okjike.com/originalPosts/689d3481394902bea926818e

    今日即刻镇小报内容来自 @于冬琪 @抬头背挺直 @携隐 Melody @飞行器地执行周期 ,感谢以上即友的创作与分享。
  9. 现在用 +86 手机号注册 Telegram 账号要支付每账号 1.19 美元的费用,官方理由是在中国发验证码短信太贵了。开 Telegram 会员可以免交收这笔费用

    #慢讯
  10. 闲鱼自动回复 - xianyu-auto-reply

    https://github.com/zhinianboke/xianyu-auto-reply

    闲鱼自动回复管理系统是一个基于 Python + FastAPI 开发的自动化客服系统,专为闲鱼平台设计。

    通过 WebSocket 连接闲鱼服务器,实时接收和处理消息,提供智能化的自动回复服务。

    多用户系统:支持用户注册登录、权限管理、数据隔离等
    多账号管理:支持无限账号管理、独立运行、实时状态监控
    智能回复系统:支持关键词匹配、指定商品回复、AI 智能回复等
    自动发货功能:支持智能匹配、多规格支持、延时发货、防重复发货等
    商品管理:支持自动收集、API 获取、多规格管理、批量操作等
    商品搜索:基于 Playwright 获取真实闲鱼商品数据,支持多条件搜索和排序
    系统监控:提供实时日志、性能监控、健康检查等功能

    #GitHub #Tool
  11. https://telegra.ph/weekly-361-08-15
    Telegraph
    科技爱好者周刊(第 361 期):暗网 Tor 安全吗?

    这里记录每周值得分享的科技内容,周五发布。 本杂志开源,欢迎投稿。另有《谁在招人》服务,发布程序员招聘信息。合作请邮件联系(yifeng.ruan@gmail.com)。 封面图 去年建成开放的烟台时光塔,是一个海边的文化建筑,下层是露天剧场,中间是望海平台,上层是图书馆、展览厅、咖啡馆。(via) 暗网 Tor 安全吗? 1、大家知道  Tor 浏览器吧? 它是访问暗网(dark web)的主要工具。 所谓暗网,就是普通浏览器打不开、必须用专门工具访问的互联网。 之所以暗网要用专门工具访问,是因为它采用…
OKHK