Skip to main content

OKHK 👀

随机碎片 / 资讯文档 / 网站工具 / GitHub 项目 / Bing 壁纸
  1. 一觉醒来发生了什么 03月31日
    #Daily

    2026年3月31日
    🌍资讯快读
    1、郑丽文回应4月访陆:这是台湾主流民意的殷殷期盼
    https://www.thepaper.cn/newsDetail_forward_32861357
    2、黑龙江海林建筑坍塌事故救援结束,7人遇难
    https://www.jiemian.com/article/14182789.html
    3、丈夫婚内赠与“第三者”财产,法院认定违背公序良俗判决返还
    https://www.thepaper.cn/newsDetail_forward_32860974
    4、中国将在长江水下开高铁
    https://www.thepaper.cn/newsDetail_forward_32860068
    5、国航中朝航线恢复运行
    https://www.jiemian.com/article/14180512.html

    👬即刻镇小报
    1、30岁上下的人,AI最是你们的机会。
    https://m.okjike.com/originalPosts/69c949dec5a1d4e6493469c0
    2、我每天会监测的健康数据
    https://m.okjike.com/originalPosts/69c9f5dcc9f973544e74a232
    3、编程,正在变成一件几乎不需要消耗专注力的事情。
    https://m.okjike.com/originalPosts/69c903f9c5a1d4e6492e16c1
    4、真正有价值的反馈,不是告诉你“应该更好”,而是准确指出你“为什么现在还不够好”
    https://m.okjike.com/originalPosts/69c920d79fe7bd898ae3e48b

    今日即刻镇小报内容来自 @张机 @小马宋 @Barret李靖 @姜旭 ,感谢以上即友的创作与分享。
  2. OKHK 👀
    https://fxtwitter.com/yetone/status/2038204630572962136
    #Prompt 开源 😁
    https://github.com/yetone/voice-input-src
    Code is cheap. Show me the talk.

    claude \
      --dangerously-skip-permissions \
      --output-format=stream-json \
      --verbose \
      -p "请实现一个 macOS menu-bar 语音输入法应用(Swift,macOS 14+),具体要求:
    
    1. 按住 Fn 键录音,松开后将转录文字注入当前聚焦的输入框。优先使用流式转录(Apple Speech Recognition framework)。Fn 键通过 CGEvent tap 全局监听,需抑制 Fn 事件传递以防止触发 emoji 选择器。
    2. 默认语言必须为简体中文(zh-CN),确保开箱即用就能识别中文输入。同时在菜单栏提供语言切换选项(英语、简体中文、繁体中文、日语、韩语)。语言选择存储在 UserDefaults 中。
    3. 录音时在屏幕底部居中显示一个特别优雅精致的无边框胶囊状悬浮窗,不要有红绿灯和 titlebar。使用 NSPanel(nonactivatingPanel)+ NSVisualEffectView(.hudWindow 材质),高度足够(56px,圆角半径 28px),包含:
       - 左侧 5 根竖条波形动画(44×32px),必须由实时音频 RMS 电平驱动(不要用写死的假动画),说话声音大波形就大、安静时波形就小。各竖条权重为 [0.5, 0.8, 1.0, 0.75, 0.55] 形成自然的中间高两侧低效果,平滑包络(attack 40%、release 15%),每根竖条添加 ±4% 随机抖动增加有机感。波形要足够大,清晰可见。
       - 右侧文字标签(弹性宽度 160-560px)实时显示转录文本,胶囊随文字变多而弹性变宽
       - 入场弹簧动画(0.35s)、文字宽度平滑过渡(0.25s)、退场缩放动画(0.22s)
    4. 文字注入使用剪贴板 + 模拟 Cmd+V 粘贴方式,注入前需检测当前输入法:如果是 CJK 输入法,先临时切换到 ASCII 输入源(ABC/US 键盘)再粘贴,粘贴完成后恢复原输入法,防止中文输入法拦截 Cmd+V。注入完成后恢复原剪贴板内容。
    5. 接入 LLM 来提升语音识别的准确率,尤其是中英文混杂的情况下。通过 OpenAI 兼容 API(可配置 API Base URL、API Key、Model)对转录文本进行 refine。LLM 的 system prompt 要求非常保守地纠错:只修复明显的语音识别错误(如中文谐音错误、英文技术术语被错误转为中文如「配森」→「Python」、「杰森」→「JSON」),绝对不要改写、润色或删除任何看起来正确的内容,如果输入看起来正确则必须原样返回。
    6. 在菜单栏提供 LLM Refinement 子菜单,包含启用/禁用开关和 Settings 入口。Settings 窗口包含 API Base URL、API Key、Model 三个输入框,API Key 输入框要能完全清空,以及 Test 和 Save 按钮。松开 Fn 键后如果 LLM 已启用且已配置,悬浮窗显示 Refining... 状态,等 LLM 返回后再注入最终文本。
    7. 应用以 LSUIElement 模式运行(仅菜单栏图标,无 Dock 图标)。使用 Swift Package Manager 构建,提供 Makefile(build/run/install/clean),构建产物为签名的 .app bundle。"
    GitHub - yetone/voice-input-src
  3. 把自己这两个月的记录 life 的 cli 小工具开源了,比较有趣的地方是它支持 iOS 快捷指令可以随时随地在手机记,支持 TUI 支持 —week, 一个 README 记录你的 life (推荐 private 仓库)
    https://github.com/yihong0618/lfn
  4. 一觉醒来发生了什么 03 月 30
    #Daily

    2026 年 3 月 30 日
    🌍 资讯快读
    1、太原一高层建筑火灾已致 3 死 23 伤,其中 9 人伤势较重
    https://www.thepaper.cn/newsDetail_forward_32855688
    2、北京启动智能网联新能源汽车商业保险开发应用
    https://www.jiemian.com/article/14179658.html
    3、女子被羁押 821 天后不予起诉申请国家赔偿被叫停,当地成立联合调查组
    https://www.thepaper.cn/newsDetail_forward_32856029
    4、美国防部正为“在伊朗展开为期数周的地面行动”做准备
    https://www.jiemian.com/article/14179055.html
    5、宇树科技具身智能体验馆亚洲首店将于 5 月底落地上海
    https://www.jiemian.com/article/14179385.html

    👬 即刻镇小报
    1、《挽救计划》观后感:每个人都需要一次 Hail Mary
    https://m.okjike.com/originalPosts/69c8aae851449d16de2f2943
    2、很多健康问题在睾酮水平恢复正常后都会自动消失
    https://m.okjike.com/originalPosts/69c4f7172307ef907333642b
    3、能超越古今中外民族语言完成人类共同情感的交互,这就是文学与音乐的意义吧
    https://m.okjike.com/originalPosts/69c721af800201ac68e9a576
    4、人间行路,本就无章可循
    https://m.okjike.com/originalPosts/69c8a7b1844afeb86e40390f

    今日即刻镇小报内容来自 @Szhans @数字游民 Jarod @漆蝶 @飞行器地执行周期 ,感谢以上即友的创作与分享。
  5. 我录入了 14 亿条数据泄漏信息,搓了一个 个人信息 “泄漏” 检测工具

    据公开传播的泄漏数据, 花了几天 搓了一个 个人信息 “泄漏” 检测工具。

    地址: https://breach.garinasset.com/

    主要特点:

    1. “不记录”「查询记录」
    2. “不提供”「隐私信息」


    https://www.v2ex.com/t/1202064
  6. Koe(声) - macOS 语音输入工具

    https://github.com/missuo/koe

    所有配置存储在纯文本文件中(~/.koe/),纯文本词典文件辅助语音识别,可通过 AI 批量添加相关专业术语。

    支持云端 ASR(豆包 / 千问)和本地 ASR(MLX / Sherpa-ONNX)两种方式,通过 OpenAI 格式 API 调用 LLM 进行文本纠正。

    应用体积仅 15 MB 左右,内存占用约 20 MB,基于 Rust 核心库来处理 ASR、LLM 和配置管理。

    #macOS #Voice #AI #Tool #GitHub
OKHK