Skip to main content

OKHK 👀

Thinking ❤️
  1. 秋季的英格兰湖区格拉斯米尔风景宁静如画,平静的湖面倒映着秋叶的缤纷色彩,翠绿的草地和连绵起伏的山丘在粉色的天空下交相辉映。
  2. https://favicon.inbrowser.app/tools/favicon-generator

    Favicon Generator | Favicon InBrowser.App

    https://favicon.inbrowser.app/tools/favicon-generator

    在浏览器中运行的生成 favicon 的工具。它不需要服务器端代码,完全由客户端执行。
    提供了一个简单的界面,让用户能够上传或拖拽图像,并生成各种尺寸和格式的 favicon。
    生成的 favicon 文件被压缩优化,并提供了一些代码示例,方便直接添加到网站的 HTML 文件中。
    用户可以修改网站 manifest 文件中的一些设置,如应用程序名称、描述、主题颜色等。

    #Design #Image #URL #Tool
  3. Reorx’s Forge
    https://www.timescale.com/blog/vector-databases-are-the-wrong-abstraction/ 一般来说,向量数据库的定位都是一个辅助组件,存储核心数据所生成的 text embedding。但当核心数据发生变化,向量存储(包括 metadata)也必须更新,这意味着一致性维护的负担,系统会越来越复杂和容易出错,我在开发 RAG 应用的过程中对此有着深刻的体会。 "You're building a RAG system, and your team…
    向量数据库凉了吗? 这篇文章从另一个角度得出向量数据库弊大于利的结论,摘录如下:

    专用向量数据库早在几年前就出现了,比如 Milvus,主要针对的是非结构化多模态数据的检索。例如以图搜图(拍立淘),以音搜音(Shazam),用视频搜视频这类需求;PostgreSQL 生态的 pgvector,pase 等插件也可以干这些事。总的来说,算是个小众需求,一直不温不火。

    向量数据库是一个伪需求吗?答案是:向量的存储与检索是真实需求,而且会随着AI发展水涨船高,前途光明。但这和专用的向量数据库并没有关系 —— 加装向量扩展的经典数据库会成为绝对主流,而**专用的向量数据库是一个伪需求**。

    在绝大多数情况下,使用专用向量数据库的弊都要远远大于利:数据冗余、 大量不必要的数据搬运工作、分布式组件之间缺乏一致性、额外的专业技能带来的复杂度成本、学习成本、以及人力成本、 额外的软件许可费用、极其有限的查询语言能力、可编程性、可扩展性、有限的工具链、以及与真正数据库相比更差的数据完整性和可用性。用户唯一能够期待的收益通常是**性能** —— 响应时间或吞吐量,然而这个仅存的“优点”很快也不再成立了…
  4. https://www.timescale.com/blog/vector-databases-are-the-wrong-abstraction/

    一般来说,向量数据库的定位都是一个辅助组件,存储核心数据所生成的 text embedding。但当核心数据发生变化,向量存储(包括 metadata)也必须更新,这意味着一致性维护的负担,系统会越来越复杂和容易出错,我在开发 RAG 应用的过程中对此有着深刻的体会。

    "You're building a RAG system, and your team uses Pinecone as a vector database to store and search embeddings. But you can't just use Pinecone—your text data doesn't fit well into Pinecone's metadata, so you're also using DynamoDB to handle those blobs and application data. And for lexical search, you needed OpenSearch. Now you're juggling three systems, and syncing them is a nightmare."

    Vector databases treat embeddings as independent data, divorced from the source data from which embeddings are created, rather than what they truly are: derived data. By treating embeddings as independent data, we’ve created unnecessary complexity for ourselves.

    这篇文章批判向量数据库的原罪,把原因讲得很透彻——向量数据库把向量当作独立数据存储,但他们其实是派生数据,应该与核心数据相邻存放,由数据库来维持更新和一致性。

    In this post, we'll propose a better way: treating embeddings more like database indexes through what we call the **"vectorizer"** abstraction. This approach automatically keeps embeddings in sync with their source data, eliminating the maintenance costs that plague current implementations.

    文章提出了 vectorizers 的概念,类似 index,vectorizer 在创建之后会自动维护表中字段的向量化数据,无须手动进行 C/U/D。他们开发了一个叫 pgai 的工具,为 PostgreSQL 提供了 vectorizer 功能。我认为这个设计理念是向量存储的未来,希望 pgai 能尽早稳定并推广,启发更多数据库做出类似实现。 Vector Databases Are the Wrong Abstraction
  5. 阿里巴巴全球数学竞赛组委会发布关于“中专天才少女姜萍”的情况说明称,江苏省涟水中等专业学校教师王闰秋在预选赛中对其指导的姜萍提供帮助,违反了预选赛关于“禁止与他人讨论”的规则。根据决赛阅卷结果,二人未获奖。
    声明称。该事件暴露出竞赛赛制不够完善、管理不够严谨等问题。组委会对此致歉,并将听取各方的批评和建议,让竞赛活动更加规范。
    涟水中专亦发布情况通报称,经研究给予王闰秋诫勉谈话处理,取消本年度评先评优资格。
    达摩院江苏省涟水中等专业学校
  6. 一觉醒来发生了什么 11月03日

    2024年11月3日
    🌍资讯快读
    1、二十届中央第四轮巡视开始进驻
    https://www.jiemian.com/article/11931585.html
    2、2024年国家医保谈判结果预计11月底发布
    https://www.jiemian.com/article/11930779.html
    3、台风“康妮”对浙江影响基本结束,浙江省防指结束防台风应急响应
    https://www.jiemian.com/article/11931058.html
    4、美特勤局:特朗普竞选集会遇刺事件是“特勤局的失败”
    https://www.jiemian.com/article/11930970.html
    5、美国将向中东地区部署额外军事力量
    https://www.jiemian.com/article/11930818.html

    👬即刻镇小报
    1、每个人都能对《再见爱人》做出一些评价,因为旁观者视角,的确是容易很多
    https://m.okjike.com/originalPosts/67261d2b729552e867c202f8
    2、可惜的是,很多人一直在用错误方法学习
    https://m.okjike.com/originalPosts/6725cd30a59d13d6d19ee5ae
    3、英语和设计是很多独立开发者都想掌握的技能
    https://m.okjike.com/originalPosts/6725c5b5c6c0d2e08835810d
    4、能平静地咽下多大的委屈和辛苦而不喊痛,决定了你能走多远的路
    https://m.okjike.com/originalPosts/67259eb6a59d13d6d19bf6ad

    今日即刻镇小报内容来自 @InClouds @广屿Ocean的笔记本 @出海去孵化器 @Milkdromeda ,感谢以上即友的创作与分享。
  7. Karing - Clash compatible & Powerful proxy utility

    https://github.com/KaringX/karing

    https://karing.app/

    Karing 是一个功能强大的代理工具, 兼容 Clash、V2ray/V2fly、Sing-box、Shadowsocks 等多种订阅格式, 并支持全面的 Clash 配置。它使用 Flutter 开发, 跨平台性能卓越, 并采用 Sing-box 内核确保优异的性能表现。

    #GitHub #Network #Tool #Clash GitHub - KaringX/karing: Simple & Powerful proxy utility, Support routing rules for clash/sing-box
OKHK