每日产生 1440 万条数据，如何做到查询效率在百毫秒内体验？

每隔十秒产生1万条数据，每一条数据约260字节。
数据产生时间9:30－11:30；13:00 －15:00。在这个时间段内一天数据量约为：$1万*6*60*4 = 1440万条，约3.5GB数据$。长期预估1-3年内产生：3.7TB数据。
已产生数据非常小量更新操作，可以任务数据库无更新操作（如update ，delete），只有插入、查询操作（insert 、select）
无复杂查询。如：group by ，join
查询操作并发度不高，但查询效率严格控制在十毫秒到几百毫秒内。
对写数据库操作要求高，达到10秒内完成插入1万条数据
每条数据字段都是数字或段文字，没有复杂字段。
选择什么样物理服务器＋数据库＋数据架构？如dell r730+mysql＋分库分表？

ksupertu

2015 年 7 月 9 日

后端elasticsearch存储，调优后单台2W/S写入速度，可水平扩展集群系统，前面可以在加个mogodb之类的数据库来持久化一下，elasticsearch丢起数据来集群恢复起来很慢

kurosagi

2015 年 7 月 10 日

1,可以不更新，就插入和查询
2,无复杂查询
3 写数据库操作要求高
4 没有复杂字段

我知道可能不行，以前也就实习的时候用过，但是dynamoDB和cassandra怎么样？

理论上，可能，好像，没问题，但是似乎有人告诫我NoSQL是坑不要入。

zhanglp888

2015 年 7 月 10 日

@hbq 我是你的百分之一的量，效率方面也就没有参考价值了！我的问题还要面对很多数据去组合，group by 的问题。

@em70 讲的最好了，想要速度，就得需要更大的空间去做索引或缓存

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.