Skip to main content

Search: #Prompt

Thinking...
❤️ PM:https://t.me/iokhk?direct
  1. OKHK 👀
    https://fxtwitter.com/yetone/status/2038204630572962136
    #Prompt 开源 😁
    https://github.com/yetone/voice-input-src
    Code is cheap. Show me the talk.

    claude \
      --dangerously-skip-permissions \
      --output-format=stream-json \
      --verbose \
      -p "请实现一个 macOS menu-bar 语音输入法应用(Swift,macOS 14+),具体要求:
    
    1. 按住 Fn 键录音,松开后将转录文字注入当前聚焦的输入框。优先使用流式转录(Apple Speech Recognition framework)。Fn 键通过 CGEvent tap 全局监听,需抑制 Fn 事件传递以防止触发 emoji 选择器。
    2. 默认语言必须为简体中文(zh-CN),确保开箱即用就能识别中文输入。同时在菜单栏提供语言切换选项(英语、简体中文、繁体中文、日语、韩语)。语言选择存储在 UserDefaults 中。
    3. 录音时在屏幕底部居中显示一个特别优雅精致的无边框胶囊状悬浮窗,不要有红绿灯和 titlebar。使用 NSPanel(nonactivatingPanel)+ NSVisualEffectView(.hudWindow 材质),高度足够(56px,圆角半径 28px),包含:
       - 左侧 5 根竖条波形动画(44×32px),必须由实时音频 RMS 电平驱动(不要用写死的假动画),说话声音大波形就大、安静时波形就小。各竖条权重为 [0.5, 0.8, 1.0, 0.75, 0.55] 形成自然的中间高两侧低效果,平滑包络(attack 40%、release 15%),每根竖条添加 ±4% 随机抖动增加有机感。波形要足够大,清晰可见。
       - 右侧文字标签(弹性宽度 160-560px)实时显示转录文本,胶囊随文字变多而弹性变宽
       - 入场弹簧动画(0.35s)、文字宽度平滑过渡(0.25s)、退场缩放动画(0.22s)
    4. 文字注入使用剪贴板 + 模拟 Cmd+V 粘贴方式,注入前需检测当前输入法:如果是 CJK 输入法,先临时切换到 ASCII 输入源(ABC/US 键盘)再粘贴,粘贴完成后恢复原输入法,防止中文输入法拦截 Cmd+V。注入完成后恢复原剪贴板内容。
    5. 接入 LLM 来提升语音识别的准确率,尤其是中英文混杂的情况下。通过 OpenAI 兼容 API(可配置 API Base URL、API Key、Model)对转录文本进行 refine。LLM 的 system prompt 要求非常保守地纠错:只修复明显的语音识别错误(如中文谐音错误、英文技术术语被错误转为中文如「配森」→「Python」、「杰森」→「JSON」),绝对不要改写、润色或删除任何看起来正确的内容,如果输入看起来正确则必须原样返回。
    6. 在菜单栏提供 LLM Refinement 子菜单,包含启用/禁用开关和 Settings 入口。Settings 窗口包含 API Base URL、API Key、Model 三个输入框,API Key 输入框要能完全清空,以及 Test 和 Save 按钮。松开 Fn 键后如果 LLM 已启用且已配置,悬浮窗显示 Refining... 状态,等 LLM 返回后再注入最终文本。
    7. 应用以 LSUIElement 模式运行(仅菜单栏图标,无 Dock 图标)。使用 Swift Package Manager 构建,提供 Makefile(build/run/install/clean),构建产物为签名的 .app bundle。"
    GitHub - yetone/voice-input-src
  2. LLM 生成文本陈词滥调汇总,将文件内容作为 System Prompt 或其他方式加载进 LLM 上下文窗口中,从而让 AI 识别并规避此类文本写作模式,使得生成的内容更接近于真人文本。

    https://tropes.fyi/tropes-md

    https://gist.github.com/ossa-ma/f3baa9d25154c33095e22272c631f5a1

    #Prompt #AI #Doc
  3. Awesome AI Art Pics Prompts - Gemini Nano Banana Pro 高质量提示词与生成案例

    https://github.com/Jermic/awesome-aiart-pics-prompts

    从 X (Twitter)、小红书等全球社交媒体平台精心收集了 3000+ 高质量提示词,涵盖摄影、插画、3D 渲染、UI 设计、创意海报等 20+ 个专业领域,全方位展示 Google 图像生成模型的无限可能

    #AI #Image #Prompt #GitHub GitHub - Jermic/awesome-aiart-pics-prompts: 🎨 精选 3000+ Gemini Nano Banana Pro 高质量提示词与生成案例 | 涵盖摄影、设计、艺术、营销等多领域 | 双语支持 | JSON 格式
  4. 面向开发者的 Prompt Engineering - 犀牛书

    https://prompt-engineering.xiniushu.com/

    吴恩达《ChatGPT Prompt Engineering for Developers》课程中文版,主要内容为指导开发者如何构建 Prompt 并基于 OpenAI API 构建新的、基于 LLM 的应用。

    编写 Prompt 的原则;
    文本总结(如总结用户评论);
    文本推断(如情感分类、主题提取);
    文本转换(如翻译、自动纠错);
    扩展(如书写邮件);

    #AI #Doc #Prompt
  5. promptfoo - 本地化提示词调试评估工具

    https://github.com/promptfoo/promptfoo

    promptfoo 是一个开发者友好的本地工具,用于测试 LLM 应用程序。

    它可以帮助您停止反复试错的方法,开始交付安全可靠的 AI 应用程序。

    使用自动化评估测试您的提示和模型
    使用红队渗透测试和漏洞扫描来保护您的 LLM 应用程序
    并行比较 OpenAI、Anthropic、Azure、Bedrock、Ollama 等多种模型的性能
    在 CI/CD 中自动执行检查
    与团队成员分享结果

    #Prompt #AI #Tool #GitHub
  6. OpenPromptStudio - AIGC 提示词可视化编辑器

    https://github.com/Moonvy/OpenPromptStudio

    OpenPromptStudio 是一个可视化编辑 AIGC 提示词的工具

    显示英文提示词的中文翻译
    翻译中文提示词到英文
    为提示词进行分类 (普通、样式、质量、命令)
    提供提示词的排序、隐藏功能
    导出提示词可视化结果为图片
    支持通过 Notion 管理提示词词典

    #AI #Prompt #Tool #GitHub GitHub - Moonvy/OpenPromptStudio: 🥣 AIGC 提示词可视化编辑器  | OPS | Open Prompt Studio
  7. Prompt-Optimizer - 提示词优化器,编写高质量的提示词

    https://github.com/linshenkx/prompt-optimizer

    Prompt Optimizer 是一个强大的 AI 提示词优化工具,帮助你编写更好的 AI 提示词,提升 AI 输出质量。支持 Web 应用、桌面应用、Chrome 插件和 Docker 部署四种使用方式。

    智能优化:一键优化提示词,支持多轮迭代改进,提升 AI 回复准确度
    双模式优化:支持系统提示词优化和用户提示词优化,满足不同使用场景
    对比测试:支持原始提示词和优化后提示词的实时对比,直观展示优化效果
    多模型集成:支持 OpenAI、Gemini、DeepSeek、智谱 AI、SiliconFlow 等主流 AI 模型
    安全架构:纯客户端处理,数据直接与 AI 服务商交互,不经过中间服务器
    多端支持:同时提供 Web 应用、桌面应用、Chrome 插件和 Docker 部署四种使用方式
    访问控制:支持密码保护功能,保障部署安全
    MCP 协议支持:支持 Model Context Protocol (MCP) 协议,可与 Claude Desktop 等 MCP 兼容应用集成

    #Prompt #AI #Tool #GitHub
OKHK