存储大量的文件该选用哪种数据库?

2016-08-31 17:53:57 +08:00
 jinxueliu

存储大量的文件(每个文件 10Mb 左右)该选用哪种数据库?有哪些可选方案,优缺点是什么? 希望大家不吝赐教

2037 次点击
所在节点    数据库
22 条回复
paulw54jrn
2016-08-31 17:56:17 +08:00
如果用云的话就是存 S3(或对应的服务上), 然后 meta data 存数据库用于检索.

自己搭的话可以 HDFS, 可以 NFS + RDBMS
VeryEase
2016-08-31 18:01:07 +08:00
二进制文件为什么要存数据库.... 如果真要这么做的话,可以考虑下 mongodb , 以前做过某款产品,开发版就是这么干的,后来放弃这种做法了。
lhbc
2016-08-31 18:04:48 +08:00
身为程序员
“大量”这种词就不应该说
e8c47a0d
2016-08-31 19:14:53 +08:00
为什么要存在数据库里……
hanxiV2EX
2016-08-31 19:21:47 +08:00
存文件,数据库只存路径
zhuangzhuang1988
2016-08-31 20:18:41 +08:00
@e8c47a0d 为什么不能存数据里面?!
https://book.douban.com/subject/6800774/
参见这个。。不过有好有坏。。。
whatot
2016-08-31 20:32:12 +08:00
在几乎所有情况下,都是应该减少数据库内部的数据量。
你这样使用数据库完全就是在浪费数据库的能力。

存文件还是用对象存储,元数据放数据库。
htfy96
2016-08-31 20:34:39 +08:00
建议 GlusterFS 。 mongoDB 稳定性。。 https://news.ycombinator.com/item?id=9912842
purrgil
2016-08-31 20:45:15 +08:00
什么叫大量?

2T 硬盘就叫大数据?
lcsoft
2016-08-31 21:03:04 +08:00
很好奇,除了要索引文件内容做全文搜索,还有哪些原因需要把文件塞到数据库里?
kingoldlucky
2016-08-31 21:11:26 +08:00
对象存储 ~~ 文件和元数据分开放 现在大互联网公司都这么干 对于海量小文件也适用
lianxiaoyi
2016-08-31 21:15:51 +08:00
这种东西毫不犹豫丢阿里云 oss 或者七牛啊!然后数据库装唯一标识!用数据库存储,你考虑过数据库带宽的感受没?
tjxjj
2016-08-31 21:20:13 +08:00
真和数据库压根没啥关系。数据库最多放个索引和元数据,核心还是你这些文件是否要考虑分库,分目录和带宽(如果经常要用的话,如果是图片还需要创建低分辨率的图片等等)
Powered
2016-08-31 21:23:05 +08:00
有目录的文件夹->自建分布式文件系统
没有目录的单个文件->对象存储
carmark
2016-08-31 21:32:31 +08:00
msg7086
2016-08-31 23:20:59 +08:00
文件系统就是一个数据库。
pubby
2016-08-31 23:24:56 +08:00
@carmark 在用
dsg001
2016-09-01 10:04:49 +08:00
几千万<100K 文件硬盘扛不住,压缩后扔到数据库
jinxueliu
2016-09-01 10:53:02 +08:00
@lhbc @purrgil 可能我的表述有问题,重点是想解决文件分布式存储的问题,使得每个节点都能快速访问
ooonme
2016-09-01 12:31:51 +08:00
@jinxueliu hdfs 太小的文件要做合并的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/302978

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX