妹纸求方案点评:分布式下的导入进度条获取,限制同一数据表同一时间只能导入一次

2019-06-28 18:05:15 +08:00
 Breadykid

将将将~ 最近领了个需求,如题

我的想法是: 每次导入用数据表生成唯一 tag,key=tag,value=导入进度,存入 redis,并开启导入线程进行 value=导入进度的更新,获取该导入操作的进度直接拿 key=tag 查找 redis 就行,导入完成后把 redis 里这条 key=tag 删掉。 其中,由于导入时间不可控,ttl 时间需要在更新 value=导入进度时同步更新。。。

蓝吼,领导否定了这个想法,建议用 mysql 建一张表替代 redis 的操作,说是可以解决并发和服务突然挂掉问题。。。 同事建议用 zookeeper 来解决。。。

我不晓得我的这个方案在微服务分布式下会产生神马问题哇?

btw:spring cloud,mysql,redis

2530 次点击
所在节点    程序员
25 条回复
AlloVince
2019-06-28 18:14:16 +08:00
为一个进度条建一张表…… #论系统里上千张表是从哪里来的#

异步任务重要的应该是任务结果是否成功,进度条就算显示有偏差或者数据丢失对系统也不会有什么影响的吧
qq316107934
2019-06-28 18:27:20 +08:00
redis 不是比 mysql 更能解决并发么? mysql 读写效率没 redis 高。 如果 redis 并不是经常暴毙我个人觉得还是 redis 吧。就算挂掉了也不会有什么问题吧,大不了重新开始。
polebug
2019-06-28 19:01:18 +08:00
歪个楼(楼主不是男生吗...
Cooky
2019-06-28 19:06:53 +08:00
MySQL 什么时候能比 Redis 更扛并发了?
怕挂掉弄个主备不就得了
litujin1123
2019-06-28 19:09:39 +08:00
楼主不是男生吗...
ztmqg
2019-06-28 19:32:36 +08:00
v 站规矩: 女留微信男自强
des
2019-06-28 19:34:37 +08:00
能好好说话么?
dazkarieh
2019-06-28 19:44:59 +08:00
>求手游坑!属性:男,本硕 211,软件工程,Android && iOS && C++

女装👚大佬?
saulshao
2019-06-28 19:46:34 +08:00
首先,我要举报,楼主是个男生。
其次,我觉得你的办法比较好,虽然我不懂 redis......为了这种事在数据库里建表,实际上就是我过去 10 年的干法。这不是什么好事,关键是很难把文档维持到跟代码甚至跟表保持一致......
tyrantZhao
2019-06-28 19:48:12 +08:00
是紧要数据吗,如果是不可丢失的那就存 mysql,否则还是放 redis 吧,mysql 的并发量支撑不住那么高的请求。
p2p
2019-06-28 20:02:52 +08:00
楼主其实是妹子的领导
luw2007
2019-06-28 20:33:46 +08:00
问题:布式下的导入进度条获取,限制同一数据表同一时间只能导入一次,需要记录导入进度,解决并发和服务不稳定引发的问题

解决:
同一数据表同一时间只能导入一次。使用分布式锁就可以解决。
服务不稳定,这块只要保证存储稳定就行( redis/mysql )

领导的 mysql 方案,使用建表的方式来解决分布式锁的方式目前不太建议使用在高并发的后端服务。主要是性能太差。
同事的 zookeeper 方案,使用 zk 来做分布式锁。这个方案本身没有问题。不过考虑 zk 的部署,业务代码编写并非很容易,建议可以用来扩展思路,尝试实现一个来提高个人技术水平。
目前常规的做法都是使用 redis 加个锁,然后实时更新锁就行了。


容错性低的方案一:
1. 使用 SET NX 设置分布式锁。
set table_name 0 EX 3600 NX

table_name 表示表名
0 表示进度为 0
3600 表示到期时间。这里的到期时间需要根据业务自行调整,建议大于业务每批次的处理时间。最好等于业务表导入最小间隔。

2. 如果抢不到锁表示其他业务正在处理导入,当前线程退出或者休眠后重试。
3. 抢到锁的线程批量处理业务并实时更新进度
set table_name N EX 3600 XX

N 数字,表示当前进度

4. 处理完之后,可以删除当前 key,或者设置到期时间为下次需要运行的时间。

缺点:
1. redis 分布式锁的方案虽然简单,但是并不安全。如果存储不稳定,暂时没有特别完善的方案。 关键词:” redis 分布式锁的安全性“

2. 更新进度,直接按照 table_name 设置,可能出现当前线程卡住很长时间。这段时间中当前的锁过去后,别的线程重新设置锁。然后两个线程同时写一个 key,导致进度出现问题。

可行性:
由于没有足够的信息,无法确认方案是否满足业务需求。不过根据你领导的方案可以推断,上面这个方案在设置比较合理的到期时间之后应该问题不大。

思考题:
可以从 key 入手,设计一个容错性高的方案。
Breadykid
2019-07-01 10:11:56 +08:00
@AlloVince 个人是觉得用数据库有点重。。。所以想避免建表的操作
Breadykid
2019-07-01 10:13:30 +08:00
@qq316107934 我也觉得哇!但是他们提出了微服务挂掉,用 redis 如何解决这个问题的疑问
Breadykid
2019-07-01 10:13:51 +08:00
@polebug 妹纸!不够软的妹纸!
Breadykid
2019-07-01 10:14:32 +08:00
@Cooky 就是没钱搞主备,嘤嘤嘤。。。
Breadykid
2019-07-01 10:15:08 +08:00
@dazkarieh 那个是我蓝朋友哇
Breadykid
2019-07-01 10:15:31 +08:00
@saulshao 我真的是妹纸,嘤嘤嘤
Breadykid
2019-07-01 10:16:50 +08:00
@saulshao redis 就是非关系型数据库哇,可以看作一个超大 size 的 HashMap
Breadykid
2019-07-01 10:18:54 +08:00
@tyrantZhao 只是一个进度值的临时数据,其实用完就扔的,同感握爪

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/578392

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX