为什么比较安全的备份数是3份,而不是2份,抑或4份、5份?

2014-01-21 09:40:14 +08:00
 kalman03
3453 次点击
所在节点    问与答
14 条回复
hzlzh
2014-01-21 09:41:28 +08:00
不放心可以加密后,备份放到 Dropbox 等云服务,挂的几率很低
kalman03
2014-01-21 09:42:39 +08:00
@hzlzh 你是来广告的吗?
zoowii
2014-01-21 09:44:46 +08:00
首先认为任意时刻有2份或更多冗余时在那一时刻是安全的。
2份的话挂掉任何一份就进入单点状态,危险啊
3份的话挂掉任何一份依然还有2份,还是安全的,连续挂两份可能性太小
更多份当然更安全,但成本太高了
zhujinliang
2014-01-21 09:47:45 +08:00
偶数份,万一出现差异,你不知道哪个是正确的
奇数份,万一其中一份出现差异,还有两份相同的拷贝可以佐证这两份相同的是正确的
hzlzh
2014-01-21 09:49:55 +08:00
@kalman03 云服务 = N份,这样你就能放心了,至于备份3份,重要的数据其实是备份越多越好。
给 Dropbox 打广告?用不着吧。。。

补充:如果是重要且敏感数据,建议3份而 [不是] 4份或5份,因为 [销毁] 起来方便快速。

(via)
http://www.hanselman.com/blog/TheComputerBackupRuleOfThree.aspx
kalman03
2014-01-21 09:51:54 +08:00
@hzlzh thanks
vietor
2014-01-21 09:55:09 +08:00
不知道算法是否正确:

每个机器DOWN机的概率相同,假设为10%,那么同时DOWN机的概率是:
2台:10% * 10% = 1%
3台:10% * 10% * 10% = 0.1%
增加一台机器,就安全性增加了10倍。再考虑成本倒推,3台机器的安全性增长100倍,成本只是3倍。
rrfeng
2014-01-21 10:12:32 +08:00
假设
每做一个拷贝的代价为 p(数据价值为1)
每个拷贝被损毁的几率为 d
我们做了 n 个拷贝
任意一个拷贝完好时是没有损失的,全部损毁才会产生损失
我们来计算一下(开销)的期望:

期望=制作拷贝开销+损毁概率×数据价值
=np(1-d^n)+d^n*1
=(1-np)d^n+np


好了,下面有请 @kfc315 来分析一下这个函数,在什么情况下达到最小,以及 p 与 n 的关系。

哈哈哈哈,好无聊……
wheatcuican
2014-01-21 13:53:23 +08:00
应该安全+成本的考虑~
HeilAsuka
2014-01-21 14:01:40 +08:00
万物皆三
jk2r
2014-01-21 14:10:48 +08:00
纯数学宕机概率,5楼解释了。

成本原因也很重要:

存N份,涉及同步协议。很简单的场景,hadoop 2+1挂了1个备份namenode,zookeeper得自动再备份;更新2+1中1份内容,协商更新其余2份资源。
oldcai
2014-01-21 14:30:15 +08:00
2份就够了?自然法则?比如我们有两个眼睛,两只耳朵,两个肾。

好吧,我承认7楼8楼已经严肃回答了,我只是胡诌一下。
bleaker
2014-01-22 03:04:13 +08:00
硬盘会坏,但不会坏的这么快
msg7086
2014-01-22 07:25:22 +08:00
@oldcai 很多时候你会发现肾很不够……

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/97798

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX