V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
pureGirl
V2EX  ›  程序员

现在开源的向量数据库能做到支持千万级的数据吗

  •  
  •   pureGirl · 2 天前 · 1995 次点击
    14 条回复    2025-09-08 15:07:17 +08:00
    summerwar
        1
    summerwar  
       2 天前
    能,千万级要是不支持,那还怎么开源
    5261
        2
    5261  
       2 天前
    啥业务场景会需要用到向量数据库呢?
    fFeeOps
        3
    fFeeOps  
       2 天前
    用 ES 也能平替一把吧,ES 到千万还是轻松的
    soulflysimple123
        4
    soulflysimple123  
       2 天前
    Milvus 、Qdrant 、Weaviate 这些主流的开源向量数据库都可以
    hackpro
        5
    hackpro  
       2 天前 via iPhone
    小意思
    w568w
        6
    w568w  
       2 天前
    可以啊,之前尝试过 pg_vector 单机千万数据,单次查询 100ms
    crackidz
        7
    crackidz  
       2 天前
    可以的
    bbbblue
        8
    bbbblue  
       2 天前
    直接用服务 zilliz serverless 千万很容易 存储成本也低
    就是用 serverless 查询量上来了很烧钱。。
    Codishek2005
        9
    Codishek2005  
       1 天前 via Android
    > @5261
    > 啥业务场景会需要用到向量数据库呢?

    较常见的用途是语义搜索。比如开源图片库 Immich 可以用机器学习实现语义搜索(原理是预先用图片跑嵌入模型,生成向量存到数据库里。搜索的时候用文本也跑一遍得到向量,再从数据库里查询最接近的记录,向量方向越接近语义越接近)

    除了语义搜索之外的其他用途我不清楚
    pureGirl
        10
    pureGirl  
    OP
       17 小时 42 分钟前
    @fFeeOps 但是 es 不是语义检索
    fFeeOps
        11
    fFeeOps  
       17 小时 35 分钟前
    @pureGirl #10 7.3 版本开始就支持向量检索了,8.0 支持 HNSW
    WithoutSugarMiao
        12
    WithoutSugarMiao  
       16 小时 12 分钟前
    千万级其实都没必要特意问一下,常用的两个 pgvector 、milvus 随随便便做到。
    dorothyREN
        13
    dorothyREN  
       15 小时 4 分钟前
    啥时候千万级也成了门槛了
    icy37785
        14
    icy37785  
       12 小时 42 分钟前
    千万级的数据很少啊。怎么会有不支持的。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   975 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 20ms · UTC 19:50 · PVG 03:50 · LAX 12:50 · JFK 15:50
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.