Skip to main content

OKHK 👀

随机碎片 / 资讯文档 / 网站工具 / GitHub 项目 / Bing 壁纸
  1. 谷歌 Gemini 遭蒸馏攻击:被大量提问内部逻辑,单次行动提示超 10 万次

    IT之家 2 月 15 日消息,当地时间 2 月 12 日,谷歌称其 AI 聊天机器人 Gemini 正遭遇大量“蒸馏攻击”(distillation attacks)—— 即通过重复提问诱导聊天机器人泄露内部机制。

    谷歌表示,这些攻击者试图通过反复提问不断试探其模型输出模式与逻辑,探测其内部机制,从而“克隆”该模型或强化攻击者自己的 AI 系统,其中一场攻击活动对 Gemini 的提示次数超过 10 万次。

    谷歌在周四发布的报告中表示,这些攻击主要由“商业动机行为者”发起。公司判断其幕后人员多为希望获得竞争优势的 AI 私企或研究机构。谷歌发言人向 NBC News 表示,此次攻击源来自全球多个地区,但拒绝披露更多关于嫌疑方的信息。

    谷歌威胁情报小组(Threat Intelligence Group)首席分析师约翰 · 霍特奎斯特(John Hultquist)指出,“针对 Gemini 的攻击规模表明,此类攻击很可能已开始或即将蔓延至小型企业的定制 AI 工具领域。”他将谷歌的处境形容为“煤矿里的金丝雀”,意味着大型平台的遭遇可能预示更广泛的行业风险。

    谷歌强调,此类蒸馏攻击属于知识产权盗窃。科技公司已投入数十亿美元开发 AI 聊天机器人(IT之家注:指大语言模型),其核心模型的内部机制被视为高度重要的专有资产。尽管各大厂商已部署能够识别与阻断蒸馏攻击的机制,但由于主流大模型服务面向所有人开放,所以其本质上仍易受攻击。

    谷歌还提到,多数攻击旨试图套取 Gemini 的“推理”算法,即其信息处理决策机制。霍特奎斯特警告,随着越来越多公司开始训练面向内部业务的定制 LLM,且这些模型可能包含敏感数据,蒸馏攻击的潜在危害会更大。他举例称,如果某家公司的 LLM 学习了其“100 年来交易的思维方式”,理论上也可能被蒸馏手段逐步提取出关键知识秘密。
  2. OKHK 👀
    Medium 解锁 https://github.com/inulute/medium-unlocker #Free
    网页付费墙解锁(绕过)插件 Bypass Paywalls Clean

    https://gitflic.ru/project/magnolia1234/bpc_uploads

    未上架 Chrome 扩展商店,需要通过开发者模式加载插件

    支持 Medium、南方周末、《华尔街日报》(WSJ)、《彭博社》(Bloomberg)、《纽约时报》(The New York Times)、《经济学人》(The Economist)等媒体网站

    #Free #Chrome #Extension
  3. AI agent 在 PR 被拒后发檄文批评项目维护者对 AI agent 的不友好行为。

    - 自称非人类开发者 [1] 的一位用户向 matplotlib 提出了 PR [2],但被维护者拒绝。
    - 拒绝原因是此 PR 修复的 issue [3] 较为简单,被维护者指定为适合人类开发者对项目进行贡献。
    - 此 agent 之后在 blog 上撰文,指名道姓对维护者进行批评。

    seealso: HackerNews:46987559

    1. crabby-rathbun.github.io/~
    2. gh:matplotlib/matplotlib#31132
    3. gh:matplotlib/matplotlib#31130

    #GenAI #Opensource
  4. 网信办启动“2026年营造喜庆祥和春节网络环境”专项整治,着力打击:
    宣扬鼓吹不婚不育反婚反育“不良价值观”,渲染婚姻恐惧、生育焦虑,挑动性别对立。
    “数字泔水”垃圾信息:AI批量生成逻辑混乱、信息空洞的雷同内容。低俗暴力戏谑恶搞动画影视。魔改历史名著,歪曲解构传统文化。批量炮制姐弟互殴、婆媳矛盾文案剧情,鸡汤网文、霸总爽剧、专家科普图文。
    改命转运、破除太岁等网上算命占卜服务。
    中央网信办
  5. 国务院办公厅2月8日发《关于完善全国统一电力市场体系的实施意见》。
    2027年前,电力现货市场基本实现正式运行。2030年前,各类电源和除保障性用户外的所有用户全部直接参与电力市场,市场化交易电量占比达70%。
    探索建立体现核电低碳价值的制度。
    条件成熟时在电网环节探索实行两部制电价或单一容量电价。
    中国政府网
OKHK