全库遍历速度哪家强?

2014 年 11 月 10 日
 uleone
业务中需要对数据库中4000万条数据进行逐条遍历,数据总量20多G,要求1分钟内能取出所有数据。
目前使用的是MongDB,一主一丛,16G内存。并发查询最快3分钟多钟完成。且并发数多了会变慢。
有没有其他更好的方案可以提升全库遍历的速度?比如哪种内存数据库?
4486 次点击
所在节点    问与答
13 条回复
kingwkb
2014 年 11 月 10 日
redis
ipconfiger
2014 年 11 月 10 日
文件
uleone
2014 年 11 月 10 日
@kingwkb redis的全库遍历怎么做?SCAN命令吗?速度怎么样?
uleone
2014 年 11 月 10 日
@ipconfiger 文件会比MongoDB快吗?
ipconfiger
2014 年 11 月 10 日
@uleone 直接下载啊,当然快啦
ziyuan
2014 年 11 月 10 日
理论上,内存数据库+网格计算是最快的了,成熟的产品有oracle exdata,如果不考虑成本的话
vietor
2014 年 11 月 10 日
可以考虑使用 ElasticSearch
msg7086
2014 年 11 月 10 日
数据20G,内存16G,你是怎么放进内存里的……

如果是读写硬盘的话,你们用了SSD RAID了吗?
uleone
2014 年 11 月 10 日
@msg7086 目前MongoDB是16G,肯定不是全在内存中。其他方案的话内存可以加,SSD用不上。
msg7086
2014 年 11 月 10 日
@uleone 没有SSD,内存也不够全放的话,势必会受到机械磁盘读写速度的影响,每秒只能随机寻找100次数据,最多了。
Kabie
2014 年 11 月 10 日
....不是全内存肯定会慢吧。。。

你先试试能完全放在内存里的数据……
charlestang
2014 年 11 月 10 日
楼主是不是应该介绍一下数据的类型,比如4000万行数据,有几个字段,分别什么类型的,全是整数,还是全是字符串,或者别的。为什么需要的不是查询,而是全部遍历?这个需求本身比较奇怪吧……
hiddenman
2014 年 11 月 11 日
真羡慕有这么多数据的环境。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/145397

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX