天翼云盘很坑

2020-05-19 20:27:21 +08:00
 janssenkm

我做了一个很极端的测试:

测试环境:

电信宽带 300M ;

Intel i7-10710u, 64G DDR4-2400,1T SN550 SSD;

Synology DS1918+ w/ 4T 红盘*4 RAID5;

天翼云盘客户端( windows )当下最新版( v6.2.3 )

数据来源

通过 rsync 方式同步一份 http://mirror.rackspace.com/centos-vault 下的文件,因为比较大,所以我只选择了这几个子目录:

http://mirror.rackspace.com/centos-vault/6.6

http://mirror.rackspace.com/centos-vault/6.7

http://mirror.rackspace.com/centos-vault/6.8

http://mirror.rackspace.com/centos-vault/6.9

http://mirror.rackspace.com/centos-vault/7.3.1611

http://mirror.rackspace.com/centos-vault/7.4.1708

http://mirror.rackspace.com/centos-vault/7.5.1804

http://mirror.rackspace.com/centos-vault/7.6.1810

http://mirror.rackspace.com/centos-vault/7.7.1798

http://mirror.rackspace.com/centos-vault/8.0.1905

因为这些文件内有从 1kb 到 10Gb 的文件,可以模拟各种复杂的文件大小( yum 源使用就不说了)

上传数据到天翼云盘

因为天翼云盘很不稳定,上传出错后再点继续就会产生一堆被重命名的文件,这是我对其最吐槽的问题,“自作主张”。

所以我很小心逐个将 centos-vault 文件夹下各个子目录逐个拖进天翼云盘客户端,逐个传,如果哪个目录出现错误,或者断流,就整个子目录全部删除后重新再传,通过此行为保证我的操作不会产生重复文件,没办法,重命名整怕了,这是个天翼云盘的巨坑。

就这样连续不停地传我把它们都传到了天翼云盘服务器上了,不过也好,人不花时间,就是把机器一直开着就行了。

下载数据到本地

天翼云盘没有指定文件夹查看该文件夹下文件数量,占用空间,于是我就本地新建一个文件夹,将之前传上去的全部重新取下来,然后检查是否和原始上传文档一致

惨不忍睹的结果

结果大跌眼球:

上传信息

上传的总文件数量:986952 个

上传的总文件夹数量:4405 个

上传的总文件大小:1,324,237,916,221 字节(约 1.20TB )

下载信息

下载到总文件数量:994131 个

下载的总文件夹数量:4405 个

下载的总文件大小:1,325,886,283,254 字节(约 1.20TB )

结果

我控制着每次上传都不重复,所以按此来看应该不会产生被重命名的文件,可结果的确是,即便是我每个文件夹一次性成功上传,天翼云盘服务端也会产生一大堆貌似被检测到重名后自作主张进行重命名的文件,结果如下:

产生重名文件数量:7179 个

产生重名文件夹数量:0 个

不一致的字节数差距:1,648,367,033 字节(约 1.53GB )

部分被重命名的文件信息:

因为它重命名规则大概是:原始文件名(时间戳).原始后缀

所以搜索“(”或者")"就能找出来,结果大部分重命名了一次,也有一小堆(上百个)被重命名了超过 1 次:

如原始文件名:

at-spi-1.28.1-2.el6.centos.i686.rpm

传上去后变成三个:

at-spi-1.28.1-2.el6.centos.i686.rpm

at-spi-1.28.1-2.el6.centos.i686(20200518055049).rpm

at-spi-1.28.1-2.el6.centos.i686(20200518060307).rpm

这行为是什么意思?这是在同一个上传批次里产生的,一个文件居然重名两次!

这是一组较为暴力的测试,排除我很小心避免多次上传同一文件的条件下,还出现这种问题,只能说明天翼云盘在服务端的分布式存储也有很大的隐患(哈希对比,文件分片,文件合并等等)。 要拿来珍藏自己的宝贝的得当心了。

13181 次点击
所在节点    宽带症候群
56 条回复
meisen
2020-05-19 21:16:03 +08:00
我是不存放任何文件在天翼云盘,偶尔使用是因为别人分享的文件在天翼。
zxy
2020-05-19 21:18:11 +08:00
30T 也就存点不重要的,直链下载比较方便
Smilencer
2020-05-19 21:20:29 +08:00
百度云盘欢迎你~
linzh
2020-05-19 22:22:05 +08:00
百度云怎么样有试过吗
janssenkm
2020-05-19 22:25:29 +08:00
@zxy
@meisen
@Smilencer
@linzh
本想这货用来存放很冷很冷的但又占地方的还行,没想到这么糟糕
aydd2004
2020-05-19 22:30:21 +08:00
我最近注册过天翼的还有联通的网盘,坑都无限多,虽然百度很恶心 但是这两个在他面前没有一个能打的。

我唯一用过最满意的是 10 年前本地电信的一个破网盘,好像是 5G 大小,存点小资料无敌。

上传 /下载 全部 100m 跑满。
Atomo
2020-05-19 23:56:03 +08:00
重名文件都会在结尾标注日期,如(20200519),用客户端搜索功能,全盘检索这个"(202005' 关键词,就可以批量删除
注意:是英文的括号
janssenkm
2020-05-20 00:37:06 +08:00
@Atomo
这些删除没问题,我关心的是

1. 重名文件为何会大量产生?即便我保证客户端上传队列中没有重名且没断流。

2. 重名都能这么玩出来,如果我客户端没问题的话,那就是服务端的问题,如果是服务端的问题的话,他没法让我相信文件真的能完整上传。我如何在服务端检测这个目录下的文件是否真正上传完毕?可惜没有,还得重新下载回来检测;

3. 且不说我多出来了几千个文件,你就批量删除 1000 个试试?

其实归根结底还是一个问题,重名文件天翼云盘干嘛要自动改名?这功能完全是反人类的,也许设计时只考虑了上传照片防止各个设备区别导致重名,所以这网盘的设计应该只是给用户传照片的,不能传其它的。但天翼云盘放自己的照片,呵呵,不敢
janssenkm
2020-05-20 00:38:34 +08:00
@Atomo
补充第三条,删 1000 个,但是前四个不删除,你操作一下试试看
EarthChild
2020-05-20 04:01:28 +08:00
天翼云盘打 10000 客服受理吗?
HTSdTt3WygdgQQGe
2020-05-20 06:08:43 +08:00
测试百度网盘的那位,已经下载到第二个文件了,各位稍后
brMu
2020-05-20 08:02:44 +08:00
我用自建 Nas !
yujiang
2020-05-20 08:10:20 +08:00
打包成压缩文件传上去应该就不会这样子了吧
dxfree
2020-05-20 08:15:04 +08:00
onedrive 不好吗
fishrimp
2020-05-20 08:29:42 +08:00
请问不敢天翼云盘放照片是什么原因?
百度网盘会修改文件的创建时间和修改时间,传照片上去就被修改日期了,很不爽。
不知道还有什么大容量免费的网盘好用了。
kpingdd
2020-05-20 08:31:35 +08:00
@q409640976 好的,在线等🐶
chentingjun
2020-05-20 08:44:26 +08:00
@yujiang 原来我照片加密打包传天翼云,几年后下载下来直接解压失败,跟原始文件一对比 md5 都不一致。
@janssenkm 有校验下 md5 看看么,结果说不定会更惨。
chentingjun
2020-05-20 08:46:34 +08:00
对了还有一个文件放了几年后下载的时候根本下不完整,下一半直接报错。
wanguorui123
2020-05-20 08:57:39 +08:00
鸡蛋不要放到一个篮子里
leafre
2020-05-20 08:59:04 +08:00
确实如此

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/673357

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX