有自建网盘的 V 友吗?

2020-08-12 17:24:03 +08:00
 naohion

主要用来存实验数据(还有 djj )小文件特别多( 300 万个),加起来没多大,4T 左右。百度盘超级会员还有 2 年,前几天公开课被百度替换成 8 秒教育片,实在忍不了,开了一个月 10TB Google One (因为 G Suite 有 40 万文件限制),rclone 用了半个月传完,发现文件夹大小都看不了,文件传没传完都不知道,打算自建。目前服务器用的是 Nextcloud,别的没问题,3900X + 32GB RAM 的服务器 300 万文件光索引就用了 2 天。干什么都要扫描 2 天,搜索一次 20 分钟没出结果。查了下有人推荐 Filerun 听说对大量文件支持很好。不知道有没 V 友用过?

9919 次点击
所在节点    云计算
56 条回复
Xusually
2020-08-12 17:33:19 +08:00
群晖?
naohion
2020-08-12 17:45:45 +08:00
@Xusually 不想买 NAS,只有一台闲置的 3900X 没独显的电脑装 CentOS 当测试服务器。不知道能不能跑黑群晖。
laminux29
2020-08-12 17:55:23 +08:00
我觉得,你的问题在于,自己的知识水平,是一个急需扫盲的阶段,却又想着做一些博学家阶段才能做的事情。

比如你说,索引用了 2 天,搜索一次 20 分钟没结果,问题是,索引与搜索阶段,你有没有分析过设备负载?甚至给开源产品直接调试做性能分析?

你这种情况,最实际的就是,直接把需求,外包给公司,花钱让别人帮你做。
Songxwn
2020-08-12 17:59:01 +08:00
seafile 用专业版
ruixue
2020-08-12 18:13:10 +08:00
G Suite 的个人云端硬盘并没有 40 万文件限制,有限制的那是共享云端硬盘,但是也没限制共享盘的数量
G Suite 可以用第三方 api 客户端来查看文件夹大小,比如 AirExplorer 等,也可以用虚拟云端硬盘直接挂载查看
zu1k
2020-08-12 18:21:45 +08:00
大量非结构化的小文件应该用对象存储吧
fhsan
2020-08-12 18:35:20 +08:00
建议 ntfs + winnt + everything,秒处理
zachlhb
2020-08-12 18:56:43 +08:00
nextcloud 要用 postgresql 数据库,性能提升不是一星半点
des
2020-08-12 19:15:25 +08:00
大量文件建议用对象存储
https://www.min.io
https://opendev.org/openstack/swift

不过首先要搞清楚,你说的搜索,打算搜索什么?
naohion
2020-08-12 20:26:31 +08:00
@des 就是普通的文件名搜索,不知道 nextcloud 有索引了为什么还这么慢。
@fhsan 没有缩略图,移动设备查看不方便。
wtks1
2020-08-12 20:47:07 +08:00
慢,是不是因为磁盘 IO 性能差?
naohion
2020-08-12 20:51:37 +08:00
@wtks1 数据库(应该包含索引)在英特尔企业级 ssd 数据盘是旧服务器上的希捷酷狼(好像叫这名字) 8T
devliu1
2020-08-12 20:53:04 +08:00
补充下 @zachlhb 的方案。Windows Server + NTFS + Everything HTTP Server,仅仅针对文件名检索
devliu1
2020-08-12 20:53:49 +08:00
@错了抱歉,应该是 @fhsan
zacklin99
2020-08-12 20:59:05 +08:00
目前用的 docker+owncloud+MySQL,感觉没啥大问题。
festoney8
2020-08-12 21:11:24 +08:00
文件名搜索和文件夹大小统计的话,NTFS 的 mft 表挺适合处理这个,用这个特性,everything 做快速搜索,wiztree 可以做快速文件夹大小统计
gjf
2020-08-12 21:11:48 +08:00
从技术角度看,如果是用自己的硬件的话(内网),可以使用至少 3 台以上 Linux 安装类似于 FastDFS 或者 MongoDB ( GridFS )分布式文件系统组成集群(高可用、有容错),这样做比较麻烦,需要自己写代码用 API 对接文件系统。
如果上云的话就是对象存储了呗
misty8873
2020-08-12 21:14:22 +08:00
用对象存储吧 简单方便。。。
siknet
2020-08-12 21:18:24 +08:00
everything 不行?
yyyb
2020-08-12 22:22:50 +08:00
如果我说用 nfs+samba+ftp 共享同一目录会有人抽我么?在家 windows 电脑挂载 samba,linux 挂载 nfs,在外用 ftp

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/697741

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX