V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cccjh
V2EX  ›  Java

数据量大,有比分库分表更好的解决方法吗

  •  
  •   cccjh · 2021-02-24 09:47:49 +08:00 · 3668 次点击
    这是一个创建于 1149 天前的主题,其中的信息可能已经有所发展或是发生改变。
    目前项目上有个表的数据每月增长 100w 条(实际 6,7,80w 吧),当前用的是 mysql,用的按月分表存储的。
    有其他方便的替代方案吗?
    目前有考虑的是用 tidb 存储
    或者 es 做存储(先不讨论 es 不适合做主存储的问题,因为公司业务,而且公司以前就用 es 做主存储过)
    第 1 条附言  ·  2021-02-24 11:00:46 +08:00
    还有是用 postgresql,公司一半业务都是用这个,也有打算让我们项目也换成这个,但我感觉数据量大了还是太慢,支撑不了业务。
    15 条回复    2021-05-18 18:43:17 +08:00
    Octopvs
        1
    Octopvs  
       2021-02-24 10:00:59 +08:00
    才 100w 啊,看你怎么用这些数据了,一千万一个表我都觉得是正常的
    lavanil
        2
    lavanil  
       2021-02-24 10:08:32 +08:00
    生产环境中 B+树的高度是 4 层就没有问题
    chencode
        3
    chencode  
       2021-02-24 10:37:07 +08:00
    我们有个日增 60W 条的单表,现在都十几亿了,只要索引建的好,sql 写的棒,速度还是杠杠的。
    不过 tidb 确实不错。扩展性好。
    cccjh
        4
    cccjh  
    OP
       2021-02-24 10:37:45 +08:00
    @Octopvs 是每月 100w,多几个月查询就特别卡了,这些数据经常会被查询统计的
    cccjh
        5
    cccjh  
    OP
       2021-02-24 10:57:31 +08:00
    @chencode 是 mysql 吗?单表过亿还不卡,具体是多少耗时,我们项目需要查询至少在 1 秒内。
    lancelee01
        6
    lancelee01  
       2021-02-24 11:03:12 +08:00
    看 SQL 吧,如果你们的 SQL 查询的时间范围跨度太大,不管什么数据库,分不分表,都查的很慢,因为相当于全表扫描。
    lancelee01
        7
    lancelee01  
       2021-02-24 11:06:45 +08:00
    大数据量,总量都没上亿 [doge]
    luoqeng
        8
    luoqeng  
       2021-02-24 11:14:31 +08:00
    NewSQL 了解下
    encro
        9
    encro  
       2021-02-24 11:25:25 +08:00   ❤️ 1
    统计,
    那么不是分库分表的问题了。
    是需要加统计表。

    我们阿里云 2 核 8G,记录大概 3 亿条,200 多 G,通常页面请求都在 0.1 秒内出来。

    你得先学会分析慢在哪里。


    https://c4ys.com/archives/2349 Mysql 必知必会 -》 Mysql 性能工具

    通常来说统计都是很慢的,需要自己加统计表。

    比如我们项目有几百个店铺,每天一个店铺几万条数据,需要统计每个店铺和所有店铺的多项指标,那么我可以加这样几个表

    stat_total_per_day
    stat_store_per_day
    stat_total_per_week
    stat_store_per_week
    stat_total_per_month
    stat_store_per_month

    stat_total_per_day 例子:
    date,key, value
    对 key,date 建立唯一组合索引。

    stat_store_per_day 例子:
    date,store_id,key,value
    对 store_id,key,date 建立唯一组合索引
    teddy2725
        10
    teddy2725  
       2021-02-24 11:44:14 +08:00
    每个月 100w 我觉得不算多,不需要分库分表。在线业务和离线分析不用放在一个库里。
    rapperx2
        11
    rapperx2  
       2021-02-24 15:43:56 +08:00
    这数据量,用你目前的方案完全够了吧
    rapperx2
        12
    rapperx2  
       2021-02-24 15:44:53 +08:00
    要么就了解下 OLAP 数据库,ClickHouse
    Leigg
        13
    Leigg  
       2021-02-24 17:21:19 +08:00 via iPhone
    一年才一千万,mysql 根据表结构情况,单表撑得住千万到亿级,pg 应该更优秀才对,你目前月表方案完全够用,如果想统计,可以用 clickhouse,但不是替换哈,是增加,ck 不支持更新删除。
    cco
        14
    cco  
       2021-03-19 11:27:44 +08:00
    - -。你这量级 mysql 完全扛得住- -。
    chencode
        15
    chencode  
       2021-05-18 18:43:17 +08:00
    @cccjh 目前已经迁移 tidb 了,单表数据十亿级别,
    试了一下,查询 5 个字段,使用一个时间范围过滤去查询,搜索 13w 条数据大概用时 4S,这里应该大部分时间用在传输上了。
    使用两个字段搜索固定单条数据,时间在 1S 左右。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5373 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 05:45 · PVG 13:45 · LAX 22:45 · JFK 01:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.