OKHK 👀
✨ Thinking ❤️
-
- 小到个人/爱好向网站,大到政企/银行网站,我都能看到Material Design 1和2的早期在很多网站上的影子,配色、按钮涟漪、阴影,都能说明对MD的认可
然后Google就把MD改成了一坨屎 - MiniMax Speech-02 语音模型
项目地址:
https://minimax-ai.github.io/tts_tech_report
体验地址:
内地: https://www.minimaxi.com/audio
海外: https://www.minimax.io/audio
全球第一个真正实现多样化、个性化定义的语音模型。
除了常用的语音克隆及TTS外,还可以实现通过对音色的文字描述生成对应音色(C端暂未上线),在同一段语音中,也可实现跨语言的高质量语音合成。
#TTS #AI #Voice #Tool #URL link - act - GitHub Action 本地运行测试工具
https://github.com/nektos/act
act 是一个可以在本地运行 GitHub Actions 的工具。
可以帮助开发者快速获得运行结果反馈,并将 GitHub Actions 用作本地任务运行器。
1. 在本地运行 GitHub Actions,无需每次提交和推送代码
2. 使用 GitHub Actions 作为本地任务运行器,替代 Makefile
3. 与 VS Code 集成,可以直接在编辑器中管理和运行 act
#DevOps #Tool #GitHub #Golang - awesome-n8n-templates - n8n 流程模板
看内容似乎来源于官方社区: https://n8n.io/workflows
(官方这个并没有在 GitHub 上托管
不知道后续维护咋样
https://github.com/enescingoz/awesome-n8n-templates
#GitHub #Tool #URL #n8n - Grok System Prompts
https://github.com/xai-org/grok-prompts
● Grok 3 聊天助手的系统提示词
● DeepSearch 功能的系统提示词
● Grok Explain 功能的系统提示词
● 𝕏 平台上 Grok 机器人的系统提示词
#AI #Prompt #GitHub - Kilo Code - 开源 AI 编程助手
https://github.com/Kilo-Org/kilocode
Kilo Code 是一个开源的 VS Code AI 编程助手。
融合了 Roo Code 和 Cline 的功能,提供了代码生成、任务自动化、代码重构等功能。
内置了最新的 AI 模型,如 Claude 3.7 Sonnet 和 Gemini 2.5 Pro,提供 $20 免费额度,无需配置 API 密钥即可使用。
● 代码生成: 使用自然语言生成代码
● 任务自动化: 自动化重复性编码任务
● 自动重构: 重构和改进现有代码
● MCP Server 市场: 轻松找到和使用 MCP Server 来扩展 Agent 功能
● 多种模式: 包括规划、编码和调试等模式,并支持自定义模式
#VSCode #Extension #AI #Tool #GitHub - Google Stitch
https://stitch.withgoogle.com/
号称是生成出色设计和 UI 界面最简单、最快捷的产品
Stitch是一个 AI 驱动的工具,帮助应用程序构建器为移动和 Web 应用程序生成高质量的用户界面,并轻松将它们导出 Figma,或直接访问前端代码。
#Google #AI link - Chrome 浏览器插件 NotebookLM
https://chromewebstore.google.com/detail/notebook-lm/dgenbagabmmjpfjlbcnnlmpopipdapjo -
- 谷歌今天在 I/O 2025 大会上宣布了一系列新的 AI 模型、工具和订阅服务
生成媒体
- Veo 3 是 Google 最先进的视频生成模型,能够创建带有音效甚至对话的视频,目前在美国,Google AI Ultra 订阅用户可以通过 Gemini 应用和 Flow 使用,也可以在 Vertex AI 上进行私人预览,并将在未来几周内更广泛地推出
- Veo 2 正在获得新功能,例如参考驱动的视频(用于一致的风格和角色)、用于精确镜头调整的相机控制、用于扩展纵横比的外画以及对象添加/删除,现在 Flow 中提供了一些新控件,而 Vertex AI 即将提供全套控件
- Imagen 4 可生成更丰富、更细致、更准确的图像,改进文本渲染和快速结果,现已在 Gemini 应用程序、Whisk、Workspace(幻灯片、文档、视频)和 Vertex AI 中免费提供,新的快速版本即将推出
- Flow 是一款全新的 AI 电影制作工具,可让您通过自然语言和资产管理,使用 Veo、Imagen 和 Gemini 创建电影剪辑;现在可供美国的 Google AI Pro 和 Ultra 订阅用户使用
- Google 的音乐生成模型 Lyria 2 现已在 Vertex AI 中上线,用于高保真自适应音乐生成,Lyria RealTime 可作为实验性交互式音乐模型通过 Gemini API 和 Google AI Studio 使用,用于实时创作和演奏生成音乐
Gemini 应用程序
- Canvas 新增一键“创建”按钮,可轻松将聊天内容转换为交互式内容,例如信息图表、测验和 45 种语言的播客,而 Deep Research 现在可让您上传文件和图像,并且即将推出 Google Drive 和 Gmail 集成
- Gemini Live 相机和屏幕共享功能现已在 Android 和 iOS 上免费提供(正在推出),并将很快与日历、Keep、地图和 Tasks 等 Google 应用集成
订阅
- Google AI Pro(每月 19.99 美元)可在美国和其他国家/地区使用,但一些最新功能(如 Chrome 中的 Flow 或 Gemini)将首先在美国推出,并计划在更广泛的范围内推出
- Google AI Ultra(249.99 美元/月,新用户前三个月可享受 50% 的优惠)提供最高的使用限制、最早使用 Veo 3 和 Gemini 2.5 Pro Deep Think 等高级模型、最高限制的 Flow,以及独家使用 Agent Mode 以及 YouTube Premium 和 30TB 存储空间,现已在美国推出,更多国家即将推出
- 美国、英国、巴西、印度尼西亚和日本的大学生可以免费获得一学年的 Google AI Pro
Chrome 和代理模式下的 Gemini
- Chrome 中的 Gemini 正在桌面上推出,供美国(英语)的 Google AI Pro 和 Ultra 用户使用,以便您可以总结、澄清和获取您正在阅读的任何网页的帮助,并通过隐私控制使 Gemini 仅在您提出要求时采取行动
- 代理模式即将面向 Ultra 桌面用户推出,该模式允许 Gemini 使用 MCP 协议和自动导航在线处理复杂的目标,例如筛选列表、填写表格或根据搜索结果进行安排
人工智能在搜索中的应用
- AI 模式将以新标签页的形式在 Google 搜索中向所有美国用户推出,该模式由 Gemini 2.5 提供支持,提供更高级的推理、更长的查询、多模式搜索和即时的高质量答案,其中的“深度搜索”可同时进行数百次搜索并综合引用的报告
- Project Astra 的实时功能(指向你的相机,询问你所看到的内容)、Project Mariner 的代理工具(购买门票、进行预订、管理任务)以及 Gmail 或其他 Google 应用的个人上下文将进入 AI 模式,由用户控制
Gemini 2.5
- Gemini 2.5 Pro 和 2.5 Flash 是领先的编码和推理基准,Gemini 2.5 Flash 有一个新的预览版本,具有更好的速度、效率和编码/推理能力,两种型号都将于 2025 年 6 月全面上市
- Gemini 2.5 Pro Deep Think 引入了一种实验性的增强推理模式,包括用于复杂任务的并行思维技术,在全面推出之前,首先通过 Gemini API 向值得信赖的测试人员推出,然后让用户控制答案深度和速度的思考预算
- Gemini API 和 SDK 原生支持模型上下文协议 (MCP),从而可以更轻松地跨系统集成代理和工具
- Gemini API 和 Vertex AI 现在提供“思想摘要”,逐步解释 Gemini 的推理和工具使用
Project Starline -> Google Beam、Astra -> Gemini Live、Mariner ->特工模式
- Starline 项目现已更名为 Google Beam,这是一个由人工智能驱动的 3D 视频通话平台,可将 2D 流媒体转化为身临其境的逼真会议,并将于今年晚些时候与惠普和其他企业合作伙伴合作推出
- Gemini Live 内置 Astra 的实时摄像头和屏幕共享功能,这些功能已在 Android 上免费提供,现已在 iOS 上推出
- Project Mariner 的代理计算机使用功能(例如多任务处理和浏览器自动化)现已面向美国 Ultra 用户开放,并将很快通过 Gemini API 和 Vertex AI 面向开发者开放
开放模型和开发工具
Gemma 3n 是一种新型高效多模态开放模型,专为快速、低内存设备设计,支持文本、音频、图像和多语言输入,目前已在 AI Studio 和 AI Edge 上为开发者提供预览版。
- Jules 是一款由 Gemini 2.5 Pro 提供支持的异步编码代理,目前处于公开测试阶段,并且免费,可在 GitHub 或您的 repo 中处理实际的编码任务,并具有并发任务和音频更新日志
- Gemini Diffusion 是一种用于快速文本生成的实验性研究模型,其输出速度约为 Google 之前最快模型的五倍,目前已通过候补名单向开发者提供预览。
SynthID Detector 是一个用于检查图像、音频、视频或文本是否由 Google 的 AI 工具生成的门户,目前正通过候补名单向早期测试人员推出,后续将提供更广泛的访问权限
#Google
https://x.com/btibor91/status/1924938391478468754?s=46&t=Egk_JeNH7VpTJDgz1k_q5w
https://blog.google/technology/developers/google-io-2025-collection/ -
-
- 一觉醒来发生了什么 05月21日
2025年5月21日
🌍资讯快读
1、四大行均下调人民币存款利率,最大降幅25个基点
https://www.jiemian.com/article/12798058.html
2、甘肃白银煤矿透水事故最新进展:3名被困矿工已无生命体征
https://www.jiemian.com/article/12800457.html
3、菲律宾华人“钢铁大王”撕票案两主谋落网,部分赎金已被提取
https://www.thepaper.cn/newsDetail_forward_30846969
4、每日475.52元!最高检公布最新侵犯公民人身自由的赔偿金标准
https://www.jiemian.com/article/12801503.html
5、微软 GitHub 推出 AI 编程智能体,可自动修复漏洞和优化代码
https://www.pingwest.com/w/304871
👬即刻镇小报
1、对普通人来说,更多时候是天赋决定下限,努力决定上限
https://m.okjike.com/originalPosts/68285a0bf0d718ce7afa210c
2、谁能定义AI产品的品牌和审美,谁也许就能做出AI版的泡泡玛特
https://m.okjike.com/originalPosts/68285768b9101b5577dcc0bd
3、如果你想获得很强的执行力,其实有两种方法
https://m.okjike.com/originalPosts/6827faccb9ea6e6da4e571cc
4、经常被忽略的信息积食
https://m.okjike.com/originalPosts/6829f0696c8a09dd8635d0e7
今日即刻镇小报内容来自 @老蒋不一定靠谱 @AI异类弗兰克 @Yangyi. @二木要多吃蔬菜 ,感谢以上即友的创作与分享。 -
-
-
- stagewise - 连接前端 UI 元素与 AI Coding Agent
https://github.com/stagewise-io/stagewise
stagewise 是一个浏览器工具栏,可以将前端 UI 与代码编辑器中的 AI Agent 连接起来。
它让前端开发者能够直接在浏览器中选择 UI 元素并进行注释和交互,将元素截图、DOM 结构等关键信息一键发送给 AI Agent 。
● 直接在浏览器中选择任意 UI 元素并发送给 AI 助手;
● 自动连接 VS Code 扩展,无需额外配置;
● 支持多种前端框架:React、Vue、Next.js、SvelteKit 等;
● 可通过自定义插件系统扩展功能;
● 提供 DOM 元素、截图和元数据给 AI 代理;
● 不会影响应用的打包体积,仅在开发模式下生效。
#AI #Tool #GitHub #Design - MCP Registry
https://github.com/modelcontextprotocol/registry
一个社区驱动的 Model Context Protocol (MCP) Server Registry 服务。
实现了一个集中的存储库,用于管理各种 MCP 实现的元数据、配置和功能。
● 提供 RESTful API 管理 MCP 注册表条目(列出、获取、创建、更新、删除)
● 提供健康检查端点用于服务监控
● 支持各种环境配置
● 优雅的关机处理
● 支持 MongoDB 和内存数据库
● 提供全面的 API 文档
● 支持分页列出注册表条目
#MCP #Golang #GitHub - Pangolin - 零信任隧道反向代理解决方案,类似 Cloudflare Zero Trust Tunnel
https://github.com/fosrl/pangolin
Pangolin 是一个自托管的隧道反向代理服务器,具有身份和访问控制功能,旨在安全地公开分布式网络上的私有资源。
它充当中央枢纽,通过加密隧道连接隔离的网络,即使在限制性防火墙后也能轻松访问远程服务,无需开放端口。
● 通过 WireGuard 隧道提供反向代理功能
● 集中身份验证系统,支持平台单点登录
● 定义 IP、IP 范围和 URL 路径的访问控制规则
● 支持 TOTP 双因素身份验证
● 支持组织、站点、用户和角色管理
● 支持外部身份提供商(IdP)集成,如 Authentik、Keycloak 和 Okta
● 支持使用 Newt 客户端或任何 WireGuard 客户端连接
● 提供全面的 API 文档,方便自动化和集成。
● 支持 HTTP/HTTPS 和 TCP/UDP 服务,具备负载均衡能力。
● 自托管部署,支持 Docker,适合多云和本地环境。
#Network #HomeLab #Tool #GitHub