V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
fourstone
V2EX  ›  外包

1.5 亿行数据,每天新增 10 万行左右, 5 分钟内提取新增行,请问能实现吗?

  •  
  •   fourstone · 2021-01-26 23:10:10 +08:00 · 377 次点击
    这是一个创建于 1211 天前的主题,其中的信息可能已经有所发展或是发生改变。
    5 分钟内提取新增 10 万行左右,反正越快越好
    用什么办法实现?服务器内存数据库?
    多少钱能开发做到?
    谢谢
    tqyq88
        1
    tqyq88  
       2021-01-26 23:17:17 +08:00
    这数据量不算大,elasticsearch 就可以做到,普通配置
    YouLMAO
        2
    YouLMAO  
       2021-01-26 23:17:26 +08:00 via Android
    提取太简单了哪需要 5 分钟,30 秒搞定
    YouLMAO
        3
    YouLMAO  
       2021-01-26 23:18:04 +08:00 via Android
    Codis 一秒百万没问题
    fourstone
        4
    fourstone  
    OP
       2021-01-26 23:18:22 +08:00
    @YouLMAO 我想要的就是每天在服务器上自动获取,自动提取,明天几亿行数据都是重复的,新的才 10 几万行
    ebingtel
        5
    ebingtel  
       2021-01-27 09:08:00 +08:00
    @fourstone 数据重复 加生成个 hash 么? 加个单表 搞个唯一键 记录下上次获取的最大 id ?
    xcstream
        6
    xcstream  
       2021-01-28 16:10:38 +08:00
    这数据量不算大 一条 sql 就能出来吧
    antpi
        7
    antpi  
       2021-01-29 10:18:49 +08:00
    YW50eDIwMDYwMQ==
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4854 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 08:35 · PVG 16:35 · LAX 01:35 · JFK 04:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.