下载服务器大批量小文件哪种方法最快

129 天前
 yh648559276
1. 在服务器上用 obsutil 工具下载 obs 里面的文件到服务器上,一共有 60g

2. 然后再用 sftp 下回 win 本地,速度最快只有 600kb/s

用什么下载方式才能把速度提起来呢?
1728 次点击
所在节点    问与答
18 条回复
liuguangxuan
129 天前
试试打包成一个大文件呢。
IvanLi127
129 天前
试试 rsync ?
lsk569937453
129 天前
问题没看懂。
1.有两个下载流程。一个是文件从 obs 到服务器,第二是文件从服务器到 win 本地。不知道你说的是哪个下载流程。
2.如果 obs 和服务器的出口网速有限制的话,你再努力也是白搭阿。
3.大批量下载文件的方法无非就是批量下载阿。你可能只是想求一个批量下载的工具?
yh648559276
129 天前
@liuguangxuan 用 tgz 打包很慢👀,60g 仅仅只是一个月的,还有其他月份的(崩溃)
explore365
129 天前
打包不压缩,http
yh648559276
129 天前
@lsk569937453 就是从文件服务器 sftp 下回本地的时候,不用 sftp 用其他方式
AreYou0k
129 天前
找个多线程下载的软件试试呗, 比如 idm
superrichman
129 天前
用 ftp 代替 sftp ,不加密传输能快很多
dier
129 天前
官方不是还提供了一个 OBS Browser+ 吗,直接用这个工具试试呢
laminux29
129 天前
当然是打包后再一次性传输,不然大部分时间开销会浪费在 HTTP 接口调用上,FTP 也有这个问题。

SVN 、GIT 因为很早就遇到这个问题,所以他们已经对大量小文件做了优化,把这些零碎小文件都打包成流,传到服务器后再切分存储,所以 SVN 、GIT 提交大量小文件的速度会非常快。
yestodayHadRain
129 天前
@dier OBS Browser+ 在处理大批量小文件的时候性能是不如 obsutil 的,文件比较大的时候不考虑带宽速度可能会差十倍以上

op 用 obsutil 下载到服务器如果服务器在阿里云这个过程是可以走内网的带宽比较大,但是用 sftp 下载到本地这个会走服务器的出网带宽 速度会受限于服务器的公网带宽,600kb/s 可能公网带宽只有 5M 左右。op 为什么非要从服务器这里过一下,直接本地下载 oss 里的资源不行吗?
lvdream
129 天前
拆分,然后多线程 scp 下载呢
yestodayHadRain
129 天前
@yestodayHadRain 文件数量比较大的时候
fordoo
129 天前
直接本地下载,如果非要服务器过一遍,那服务器负责打包成 tar ,回传到 obs 再本地下载,可以充分利用 obs 的公网带宽
wangwaner
129 天前
syncthing 同步试试看?我用这个同步两台服务器爬的几十万张图片啥的,只有刚开始同步数据量大慢一些后面就无感同步了。
libook
129 天前
ssh 两部分比较占性能,一个是加密,另一个是压缩。你看看是不是加密算法硬件支持不好或者太复杂;然后看看是不是硬件跑压缩性能不够,带宽够大的话把压缩关了试试。

根据之前调研的压测数据来看,ssh 还是比 smb 性能要好的,当然比不过不加密的协议如 nfs ,如果你确保网络环境安全的话也可以考虑 nfs 。

另外 i 也可以看看是不是远端或本地的磁盘 IO 有问题,比如碎片太多。
poopoopoopoo
129 天前
内网下载 打包上传 OBS 公网流量下载 这样最快
pen1120
128 天前
流式压缩并传送

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1006000

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX