Skip to main content

OKHK 👀

Thinking ❤️
  1. https://favicon.inbrowser.app/tools/favicon-generator

    Favicon Generator | Favicon InBrowser.App

    https://favicon.inbrowser.app/tools/favicon-generator

    在浏览器中运行的生成 favicon 的工具。它不需要服务器端代码,完全由客户端执行。
    提供了一个简单的界面,让用户能够上传或拖拽图像,并生成各种尺寸和格式的 favicon。
    生成的 favicon 文件被压缩优化,并提供了一些代码示例,方便直接添加到网站的 HTML 文件中。
    用户可以修改网站 manifest 文件中的一些设置,如应用程序名称、描述、主题颜色等。

    #Design #Image #URL #Tool
  2. Reorx’s Forge
    https://www.timescale.com/blog/vector-databases-are-the-wrong-abstraction/ 一般来说,向量数据库的定位都是一个辅助组件,存储核心数据所生成的 text embedding。但当核心数据发生变化,向量存储(包括 metadata)也必须更新,这意味着一致性维护的负担,系统会越来越复杂和容易出错,我在开发 RAG 应用的过程中对此有着深刻的体会。 "You're building a RAG system, and your team…
    向量数据库凉了吗? 这篇文章从另一个角度得出向量数据库弊大于利的结论,摘录如下:

    专用向量数据库早在几年前就出现了,比如 Milvus,主要针对的是非结构化多模态数据的检索。例如以图搜图(拍立淘),以音搜音(Shazam),用视频搜视频这类需求;PostgreSQL 生态的 pgvector,pase 等插件也可以干这些事。总的来说,算是个小众需求,一直不温不火。

    向量数据库是一个伪需求吗?答案是:向量的存储与检索是真实需求,而且会随着AI发展水涨船高,前途光明。但这和专用的向量数据库并没有关系 —— 加装向量扩展的经典数据库会成为绝对主流,而**专用的向量数据库是一个伪需求**。

    在绝大多数情况下,使用专用向量数据库的弊都要远远大于利:数据冗余、 大量不必要的数据搬运工作、分布式组件之间缺乏一致性、额外的专业技能带来的复杂度成本、学习成本、以及人力成本、 额外的软件许可费用、极其有限的查询语言能力、可编程性、可扩展性、有限的工具链、以及与真正数据库相比更差的数据完整性和可用性。用户唯一能够期待的收益通常是**性能** —— 响应时间或吞吐量,然而这个仅存的“优点”很快也不再成立了…
  3. https://www.timescale.com/blog/vector-databases-are-the-wrong-abstraction/

    一般来说,向量数据库的定位都是一个辅助组件,存储核心数据所生成的 text embedding。但当核心数据发生变化,向量存储(包括 metadata)也必须更新,这意味着一致性维护的负担,系统会越来越复杂和容易出错,我在开发 RAG 应用的过程中对此有着深刻的体会。

    "You're building a RAG system, and your team uses Pinecone as a vector database to store and search embeddings. But you can't just use Pinecone—your text data doesn't fit well into Pinecone's metadata, so you're also using DynamoDB to handle those blobs and application data. And for lexical search, you needed OpenSearch. Now you're juggling three systems, and syncing them is a nightmare."

    Vector databases treat embeddings as independent data, divorced from the source data from which embeddings are created, rather than what they truly are: derived data. By treating embeddings as independent data, we’ve created unnecessary complexity for ourselves.

    这篇文章批判向量数据库的原罪,把原因讲得很透彻——向量数据库把向量当作独立数据存储,但他们其实是派生数据,应该与核心数据相邻存放,由数据库来维持更新和一致性。

    In this post, we'll propose a better way: treating embeddings more like database indexes through what we call the **"vectorizer"** abstraction. This approach automatically keeps embeddings in sync with their source data, eliminating the maintenance costs that plague current implementations.

    文章提出了 vectorizers 的概念,类似 index,vectorizer 在创建之后会自动维护表中字段的向量化数据,无须手动进行 C/U/D。他们开发了一个叫 pgai 的工具,为 PostgreSQL 提供了 vectorizer 功能。我认为这个设计理念是向量存储的未来,希望 pgai 能尽早稳定并推广,启发更多数据库做出类似实现。 Vector Databases Are the Wrong Abstraction
  4. 阿里巴巴全球数学竞赛组委会发布关于“中专天才少女姜萍”的情况说明称,江苏省涟水中等专业学校教师王闰秋在预选赛中对其指导的姜萍提供帮助,违反了预选赛关于“禁止与他人讨论”的规则。根据决赛阅卷结果,二人未获奖。
    声明称。该事件暴露出竞赛赛制不够完善、管理不够严谨等问题。组委会对此致歉,并将听取各方的批评和建议,让竞赛活动更加规范。
    涟水中专亦发布情况通报称,经研究给予王闰秋诫勉谈话处理,取消本年度评先评优资格。
    达摩院江苏省涟水中等专业学校
  5. 一觉醒来发生了什么 11月03日

    2024年11月3日
    🌍资讯快读
    1、二十届中央第四轮巡视开始进驻
    https://www.jiemian.com/article/11931585.html
    2、2024年国家医保谈判结果预计11月底发布
    https://www.jiemian.com/article/11930779.html
    3、台风“康妮”对浙江影响基本结束,浙江省防指结束防台风应急响应
    https://www.jiemian.com/article/11931058.html
    4、美特勤局:特朗普竞选集会遇刺事件是“特勤局的失败”
    https://www.jiemian.com/article/11930970.html
    5、美国将向中东地区部署额外军事力量
    https://www.jiemian.com/article/11930818.html

    👬即刻镇小报
    1、每个人都能对《再见爱人》做出一些评价,因为旁观者视角,的确是容易很多
    https://m.okjike.com/originalPosts/67261d2b729552e867c202f8
    2、可惜的是,很多人一直在用错误方法学习
    https://m.okjike.com/originalPosts/6725cd30a59d13d6d19ee5ae
    3、英语和设计是很多独立开发者都想掌握的技能
    https://m.okjike.com/originalPosts/6725c5b5c6c0d2e08835810d
    4、能平静地咽下多大的委屈和辛苦而不喊痛,决定了你能走多远的路
    https://m.okjike.com/originalPosts/67259eb6a59d13d6d19bf6ad

    今日即刻镇小报内容来自 @InClouds @广屿Ocean的笔记本 @出海去孵化器 @Milkdromeda ,感谢以上即友的创作与分享。
  6. Karing - Clash compatible & Powerful proxy utility

    https://github.com/KaringX/karing

    https://karing.app/

    Karing 是一个功能强大的代理工具, 兼容 Clash、V2ray/V2fly、Sing-box、Shadowsocks 等多种订阅格式, 并支持全面的 Clash 配置。它使用 Flutter 开发, 跨平台性能卓越, 并采用 Sing-box 内核确保优异的性能表现。

    #GitHub #Network #Tool #Clash GitHub - KaringX/karing: Simple & Powerful proxy utility, Support routing rules for clash/sing-box
  7. 小胰宝 - 面向胰腺癌肿瘤患者的智能RAG平台

    一个为帮助胰腺癌患者提供信息和支持的开源项目。该项目由病友SamQin创立并上线,现由小胰宝开源社区团队管理。项目旨在帮助胰腺癌患者及其家属克服专业医学和治疗的信息差,提供7x24小时的智能服务,帮助他们高效、准确地理解病情状态、治疗术语、规范治疗指南以及综合治疗的复杂信息,从而选择科学和有效的治疗路线,获得更长的治疗收益。

    为胰腺癌患者提供7x24小时的智能信息服务,帮助他们了解病情、治疗方案等
    积极推动跨癌肿AGI和RAG技术应用的融合,根据不同癌症的需求,自由构建智能助手
    计划复制并推广至肺癌、乳腺癌、甲状腺癌、肝癌、肠癌等五大癌种

    https://github.com/PancrePal-xiaoyibao/PancrePal-xiaoyibao

    #GitHub #AI GitHub - PancrePal-xiaoyibao/PancrePal-xiaoyibao: 面向胰腺癌肿瘤患者的智能RAG平台
  8. 生命早期限糖可预防成年后罹患糖尿病和高血压

    2024-11-01 02:58 by 纳尼亚传奇:能言马与男孩

    根据发表在《科学》期刊上的一项研究,在生命早期(从在子宫内就开始)进行限糖可预防成年后罹患糖尿病和高血压;该研究所用的是英国二战后对糖进行定量配给的数据。这些发现凸显了在生命的最初 1000 天内减少糖的摄入可对长期健康产生重要的裨益。受孕后的头 1000 天(从妊娠到 2 岁)是关乎长期健康的重要时期。在此时期的恶劣饮食会与成年时产生不良健康后果有关。尽管饮食指南建议,在生命早期不要添加糖,但在美国,由于母亲饮食对子宫内胎儿的影响、母乳喂养以及婴儿配方奶粉和固体食物都会令孩子在生命早期接触高含量的糖变得十分常见。此外研究表明,大多数婴幼儿每天都会食用增甜的食物和饮料。二次大战后的 1953 年,英国结束了长达十年的糖和糖果的定量配给。在定量配给期间,糖的摄入量与现今的饮食指南相当,包括那些针对孕妇和幼儿的饮食指南。然而定量配给的终结几乎在一夜之间导致人们对糖的摄入量立即增加了近两倍。

    https://www.science.org/doi/10.1126/science.adn5421
    https://www.eurekalert.org/news-releases/1062746?language=chinese

    #科学
OKHK