从国外服务器下载大量数据( TB 级),求助方案

2016-05-24 18:47:20 +08:00
 seki

我所在的(小)公司需要从国外的服务器下载一个数据集,总数据量在 5TB 左右,受国内渣渣网络的原因,直接下载速度太慢,而数据下载(目前看起来)是可以直接用 http 反代的,所以需要有一些更有效率的代理中转方案。

目前我想到的方案是:阿里云的 1CPU , 1GB 内存, 5Mbps 带宽 ECS 三台并行下载。

5Mbps 带宽是因为带宽阶梯计价, 5Mbps 之后带宽单价变高,且受网络连接能力限制,即使有更高的带宽也不一定能实现满速,不如多台分别下载。云主机数量是考虑到了公司本身的下载带宽。反代工具使用 nginx ,用 python 生成 url ,下载用 python 的 requests 库(因为都是 windows 机器,装 wget 或者 curl 略麻烦)。不知道有什么更好的建议吗?

P.S. 其实 linode 东京的速度试了一下也还好,而且更便宜,但是没有发票……

8876 次点击
所在节点    问与答
32 条回复
czk1997
2016-05-25 02:32:01 +08:00
不能直接拷盘么……
按流量计费好点。
em70
2016-05-25 02:55:43 +08:00
阿里云只对下行数据收费,上行带宽是免费的,最大带宽 1G,换句话说在服务器上下载数据是免费的
w466397352
2016-05-25 09:00:12 +08:00
我也觉得最靠谱的就是人家下好把硬盘快递给你。。。
LGA1150
2016-05-25 09:08:53 +08:00
你可以试试百度云的离线下载
“ 100M 小 ISP ”是长宽?
LGA1150
2016-05-25 09:13:04 +08:00
你也可以试试联通骨干网缓存服务器( 120.52.72.*)来缓存数据,不过我怀疑它能不能缓存 TB 级数据
RqPS6rhmP3Nyn3Tm
2016-05-25 09:30:44 +08:00
迅雷离线…
xunxuntj
2016-05-25 10:08:01 +08:00
FedEx 运 5T 数据,假设空运 3 天到,试算下带宽和代价
mgna17
2016-05-25 11:18:30 +08:00
肉翻出去,下好再回来。。。。
superxzr
2016-05-25 13:16:32 +08:00
@Showfom axel 暴力上线程数可以的... 我最高试过 150 线程,在不被 QoS 的情况下从美国取到了 12.6MB/s 的好速度..(我下行不够啦
Showfom
2016-05-25 18:31:39 +08:00
@superxzr - - 可以的
kslr
2017-06-10 04:15:02 +08:00
@hicdn 哥们,你是跑了个 Windows 上传到天翼吗?
hicdn
2017-06-10 17:12:00 +08:00
@kslr 没有,写脚本用网页上传接口上传。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/280983

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX