pysex

100G 8000 万条信息全文检索, Elasticsearch 是最优选择吗?

  •  
  •   pysex · Nov 17, 2022 · 5922 views
    This topic created in 1290 days ago, the information mentioned may be changed or developed.

    数据存 MongoDB ,Elasticsearch 只存索引结果=最优选择
    还是数据做双写

    5 replies    2023-06-02 12:32:40 +08:00
    huangqihong
        1
    huangqihong  
       Nov 17, 2022
    咦,我好像在掘金看到了的
    bjzhush
        2
    bjzhush  
       Nov 17, 2022
    你没写数据的增长速度,搜索的复杂度的支持,索引的实时程度的要求,查询结果返回时间的需求,还有用户量和查询量,对弹性扩容的需求,这些都需要考虑的
    很多年没做搜索了,ES 是比较出名的,但是貌似机器的消耗也比较多
    搜索方案很多的,测试起来也很快,都可以考虑考虑
    2013 年我曾经单机 sphinx 索引过 10 亿以上数据,响应还不慢,不过需求特殊,单机版就够用哈哈哈
    pysex
        3
    pysex  
    OP
       Nov 18, 2022
    @bjzhush 那自己买一台 ECS 自建?单机的
    bjzhush
        4
    bjzhush  
       Nov 18, 2022
    @pysex 当初是帮朋友做的,我自己本机的台式机,他拿过去用也是本机。场景不一样,那个是社工库
    bigtang
        5
    bigtang  
       Jun 2, 2023
    单机不是最优选择,ES 优势在分布式上,可以参考一下 tanglib.com, 单机 800G 文本,可以做到 instant search 。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2747 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 35ms · UTC 04:47 · PVG 12:47 · LAX 21:47 · JFK 00:47
    ♥ Do have faith in what you're doing.