Skip to main content

OKHK 👀

Thinking ❤️
  1. https://www.anthropic.com/news/claude-3-7-sonnet

    https://fxtwitter.com/AnthropicAI/status/1894092430560965029

    Anthropic 发布了其最智能的模型 Claude 3.7 Sonnet,定位为市场首个混合推理模型。
    1.  Claude 3.7 Sonnet 与 Claude Code 发布
        •   Anthropic 发布了其最新、最智能的模型 Claude 3.7 Sonnet,以及新的代理编码工具 Claude Code。
        •   Claude 3.7 Sonnet 在编码和前端 Web 开发方面表现出色。Claude Code 允许开发人员从终端直接将工程任务委托给 Claude。
    
    2.  Claude 3.7 Sonnet:前沿推理能力
        •   Claude 3.7 Sonnet 集成了快速响应和深度思考能力,用户可控制模型思考时间。
        •   在标准模式下,它是 Claude 3.5 Sonnet 的升级版;在扩展思维模式下,它在数学、编码等任务上表现更佳。
        •   API 用户可以控制思考预算,权衡速度、成本和答案质量。
    
    3.  Claude 3.7 Sonnet 的性能与应用
        •   在实际编码任务中表现出色,提升了处理复杂代码库和高级工具使用的能力。
        •   在 SWE-bench Verified 和 TAU-bench 等基准测试中达到 SOTA 性能。
        •   在指令跟随、多模态能力和代理编码方面表现出色,扩展思维模式在数学和科学方面有显著提升。
    
    4.  Claude Code:首个代理编码工具
        •   作为有限研究预览版发布,可作为主动协作者搜索、读取、编辑代码,运行测试,提交代码到 GitHub 等。
        •   早期测试表明,它可以显著减少开发时间和开销,自动完成通常需要 45 分钟以上手动工作的任务。
        •   Anthropic 将根据用户反馈不断改进,包括工具调用的可靠性、支持长时间运行的命令等。
    
    5.  GitHub 集成与代码库协作
        •   GitHub 集成现已在所有 Claude 计划中提供,允许开发者将代码仓库直接连接到 Claude。
        •   Claude 3.7 Sonnet 能够更好地理解个人、工作和开源项目,成为修复错误、开发功能和构建文档的强大伙伴。
    
    6.  责任与安全
        •   经过广泛测试和评估,确保符合安全性、可靠性标准。
        •   与前代产品相比,Claude 3.7 Sonnet 能更准确区分有害和良性请求,减少了45%的不必要拒绝。
        •   发布了系统卡,详细介绍了负责任扩展政策评估,并解释了如何评估漏洞并训练 Claude 来抵御和减轻风险。
    
    7.  未来展望
        •   Claude 3.7 Sonnet 和 Claude Code 标志着 AI 系统在增强人类能力方面迈出了重要一步。
        •   它们能够深入推理、自主工作和有效协作,使我们更接近 AI 丰富和扩展人类能力的未来。
        •   Anthropic 欢迎用户反馈,并将继续改进和发展模型。

    #AI Claude 3.7 Sonnet and Claude Code
  2. #Bing_Wallpaper

    雄伟的砂岩岩柱在犹他州布莱斯峡谷国家公园的洁白雪床上戏剧性地矗立,橙红色与火红色的石柱在日出或日落时的柔光下散发着金色的光辉。那些被风雕刻出的复杂而沧桑的岩石纹理,与满覆积雪的平滑曲线形成鲜明对比,造就了一幅超现实的梦幻景象。零星点缀的常绿树木以深绿色的剪影为画面增添了深度与比例感。整个场景氛围宁静而令人敬畏,仿若一幅油画般的画质凸显出自然于粗犷与精致之间的和谐平衡。超现实的艳丽色彩、精细的纹理、广角透视和电影般的光线效果令人叹为观止。
  3. DeepSeek infra 开源周 第一天就把可能是最重要的高效 MLA 推理实现爆了

    要知道在此之前开源社区(transformers 的实现和 llama.cpp 的实现)我记得都还在用最简单最破烂的 MLA 实现,即使大推理商也好不到哪去,这本来应该是大模型真正的「护城河」(没有优化的推理实现,即使开源权重其他推理商跑的成本都会被 DeepSeek 橄榄),D 圣人决定直接给它开源...

    只能说是真不靠这个吃饭啊 真正的 OpenAI

    https://github.com/deepseek-ai/FlashMLA
  4. NeuraPress - Markdown 编辑器

    https://github.com/tianyaxiang/neurapress

    https://md.leti.ltd

    NeuraPress 是一个现代化的 Markdown 编辑器,专注于提供优质的微信公众号排版体验。

    1. 实时预览 - 所见即所得的编辑体验
    2. 移动端支持 - 支持手机上直接编辑,搭配 DeepSeek和微信公众号助手使用
    3. 微信风格 - 完美适配微信公众号样式
    4. 样式定制 - 灵活的样式配置选项
    5. 一键复制 - 支持复制带格式的预览内容
    6. 模板系统 - 内置多种排版模板,一键切换
    7. 快速高效 - 基于 Next.js 构建,性能优异

    #WeChat #Tool #GitHub #Editor GitHub - tianyaxiang/neurapress: NeuraPress 是一个现代化的 Markdown 编辑器,专注于提供优质的微信公众号排版体验。响应式设计,支持移动设备。搭配 DeepSeek和微信公众号助手使用,碎片时间也能用手机发有排版的文章了。
  5. 异地多活系统设计

    《搞懂异地多活,看这篇就够了》

    http://kaito-kidd.com/2021/10/15/what-is-the-multi-site-high-availability-design

    文章详细介绍了异地多活架构的核心思路和演进过程,从最简单的单机架构出发,逐步分析了如何通过冗余、灾备、双活等手段提升系统的可用性,最终实现异地多活的目标。此外还探讨了实现异地多活的关键技术点和挑战。

    异地多活是分布式系统架构设计的高峰,旨在提升系统的高可用性和扩展性。
    系统的高可用性由MTBF(平均故障间隔时间)和MTTR(平均故障恢复时间)决定,而冗余是提升可用性的核心手段。
    单机架构存在单点故障风险,备份虽简单但无法满足高可用性要求。
    主从副本通过实时同步提升数据完整性和抗故障能力,同时提高读性能。
    同城灾备分为冷备和热备,热备通过实时同步和提前部署实现快速切换。
    同城双活在同城灾备基础上进一步优化,两个机房同时接入流量,提高性能和可用性。
    两地三中心通过异地部署机房实现城市级别灾害的容灾,但灾备机房启用需要时间。
    真正的异地双活需要避免跨机房访问延迟,通过双主架构和数据双向同步实现「就近访问」和高可用性。
    数据冲突是异地双活的核心挑战,可通过自动合并或从源头避免冲突来解决。
    分片规则(按业务类型、哈希、地理位置)是实现异地双活的关键,确保同一用户请求在一个机房内完成闭环。
    异地多活在异地双活基础上扩展多个机房,通过星状架构简化数据同步复杂度。

    ----------------------

    作者还总结了一份各大公司异地多活设计的资料汇总:

    https://www.yuque.com/kaito-djycs/kb/gw7kbw

    #DevOps #Doc #Mark #RePost

    source
  6. 微软开源的 10节 AI Agent 教程

    手把手教你构建 AI Agents

    https://github.com/microsoft/ai-agents-for-beginners

    由微软提供的AI Agents入门课程,包含10个章节,涵盖了构建AI Agents的基础知识。课程内容包含各种AI Agents框架和服务,例如Azure AI Agent Service、Semantic Kernel 和 AutoGen,以及GitHub Models和Azure AI Foundry等模型访问途径。

    每个章节都有对应的README文件和Python代码示例,方便学习者实践。

    #AI #Doc #Microsoft #GitHub GitHub - microsoft/ai-agents-for-beginners: 12 Lessons to Get Started Building AI Agents
OKHK