Skip to main content

向量数据库凉了吗? 这篇文章从另一个角度得出向量数据库弊大于利的结论,摘录如下:专用向量数据库早在几年前就出现了,比如 Milvus,主要针对的是非结构化多模态数据的检索

  1. Reorx’s Forge
    https://www.timescale.com/blog/vector-databases-are-the-wrong-abstraction/ 一般来说,向量数据库的定位都是一个辅助组件,存储核心数据所生成的 text embedding。但当核心数据发生变化,向量存储(包括 metadata)也必须更新,这意味着一致性维护的负担,系统会越来越复杂和容易出错,我在开发 RAG 应用的过程中对此有着深刻的体会。 "You're building a RAG system, and your team…
    向量数据库凉了吗? 这篇文章从另一个角度得出向量数据库弊大于利的结论,摘录如下:

    专用向量数据库早在几年前就出现了,比如 Milvus,主要针对的是非结构化多模态数据的检索。例如以图搜图(拍立淘),以音搜音(Shazam),用视频搜视频这类需求;PostgreSQL 生态的 pgvector,pase 等插件也可以干这些事。总的来说,算是个小众需求,一直不温不火。

    向量数据库是一个伪需求吗?答案是:向量的存储与检索是真实需求,而且会随着AI发展水涨船高,前途光明。但这和专用的向量数据库并没有关系 —— 加装向量扩展的经典数据库会成为绝对主流,而**专用的向量数据库是一个伪需求**。

    在绝大多数情况下,使用专用向量数据库的弊都要远远大于利:数据冗余、 大量不必要的数据搬运工作、分布式组件之间缺乏一致性、额外的专业技能带来的复杂度成本、学习成本、以及人力成本、 额外的软件许可费用、极其有限的查询语言能力、可编程性、可扩展性、有限的工具链、以及与真正数据库相比更差的数据完整性和可用性。用户唯一能够期待的收益通常是**性能** —— 响应时间或吞吐量,然而这个仅存的“优点”很快也不再成立了…
OKHK