一次 nas 数据安全讨论发现的知识

2024-01-10 09:20:17 +08:00
 gdbeixi

前不久和同事讨论 nas 数据安全问题,他最近刚入 nas 坑,买了两个盘,由于曾经经历过多次多年数据损失,买了希捷企业盘( 8t )选择了保守的 raid1 ,我一听,觉得没必要太费空间了,况且这个盘也不便宜,而且他入的貌似四盘位 nas (没细问),于是就介绍我的处理方案:重要数据定时一个任务在两个盘内备份就好,不组阵列来容错,而且我也觉得软 raid 重建也是头大的问题。
于是就有了他灵魂的一问:万一你原始数据盘中文件部分损坏,那复制过去不是都坏了?(他看中 raid 有数据校验功能,认为 raid 可以规避这个风险)
听到愣了一下,想说这种事情概率极低吧?好像又不合适,确实有这个硬盘内比特翻转的风险,自己也经历过大量数据复制时发生数据部分损坏情况,于是没有立刻回答。
后续自己觉得这个事情不对劲,不可能存在这么大个风险而专业厂家不解决,不然 IDC 也开不下去啊,因为我自己用的是群晖,就在群晖官网找答案,果然有:https://www.synology.cn/zh-cn/dsm/Btrfs,原来在文件系统层面就已经解决了这个问题,普通用户该咋用咋用。

7462 次点击
所在节点    NAS
55 条回复
MoonLin
2024-01-10 11:43:47 +08:00
这超链识别有点奇怪啊,重新更正一次: https://blog.io01.xyz/posts/6op1/#raid-%E9%80%89%E5%9E%8B
zololiu
2024-01-10 12:14:04 +08:00
感谢这个帖子,涨知识了。
mantouboji
2024-01-10 13:00:48 +08:00
@yhm2046 比如,你要分析自己的备份需求,看是需要在线近线还是离线,是手动操作还是全自动,有没有异地容灾的需求等等。

备份可以使用各种存储设备和媒体,特点是都要跟你日常使用的存储设备分开。

比如苹果的 TimeMachine 就可以算是自动化的在线备份。

自己定时拷贝到网盘,也算是手动的在线备份。

自己准备个大容量移动硬盘,隔段时间把数据拷贝进去,算是手动的离线备份。

企业场合弄个磁带库,由软件控制定时存到磁带上,那就是自动化的离线备份。

再把这些磁带或者磁盘有好事者车载以入拉到隔壁省,那就是异地容灾了。

等等等等,不一而足,专家们可以补充。
nlfiasel
2024-01-10 13:18:46 +08:00
文件级别解决位反转可以考虑用 Parchive
gdbeixi
2024-01-10 13:22:55 +08:00
@v2tudnew 确实该补充,后续了解到,btrfs 在某些阵列时候才有修复,单盘只使用其读取时校验特性,报告文件损坏而不污染损坏文件到备份盘中,这样也就防止了错误扩大
gdbeixi
2024-01-10 13:37:24 +08:00
@ShinichiYao 这点倒是还好,做了快照以及备份不是那么频繁,文件还是能保住的🤣

@i4t 定时备份是权衡利弊下的选择,毕竟个人真正不可或缺的数据量不是那么多,绝对重要数据也遵循 3-2-1 备份原则,即保存三份文件,存储在两个不同介质中,一个异地备份,个人唯一一次文件丢失损坏还是几年前拷多年收藏的电影到 nas 中时候,回想起来应该就是拷贝时出现错误导致
lerry
2024-01-10 13:52:33 +08:00


文件真的会静默损坏,我从 17 年开始用群晖,以前就是用的楼主说的办法,定时 rsync 同步,无意发现有些照片不知道什么时候已经损坏了,从一年前开始老老实实用 raid1 。自建 nas 用 zfs raidz1 ,定期扫描。
lerry
2024-01-10 13:55:21 +08:00


对了,Btrfs 和 zfs 都支持快照,我设置了每天快照,保存三个月的版本用于解决数据误删中毒问题
gdbeixi
2024-01-10 14:10:08 +08:00
@lerry 少许疑问,按我理解损坏不是直接打不开或者少许损坏自我纠错就过了那种吗?还有就是副本也同时损坏了吗?
lerry
2024-01-10 14:22:35 +08:00
@gdbeixi #29
损坏的表现要看具体的文件类型,损失的部分重不重要,程序如何解析数据。
不知道你有没有试过播放没下载完的文件,迅雷时代经常遇到文件下载到 99%不动了,或者不到 99%,这时候用把文件拖到播放器大概率是能播的,但是无法拖动进度或者到播放到某个位置就卡住了。

副本确实坏了,但是时间太久了,中间 Nas 坏过,文件拷来拷去,已经说不好是哪一次出的问题了。
gdbeixi
2024-01-10 14:52:00 +08:00
@lerry 视频损坏倒是了解其能继续播放,之前拷贝时损坏过,中间有几帧卡丢那种,图片( jpeg )我一直认为其用了压缩要是有损坏就拿不到完整 bitmap ,看来还是知识浅薄了🤣
weidaizi
2024-01-10 15:02:40 +08:00
哈哈哈哈,正好昨天实现了一个冷备方案的小工具,OP 可以看这个帖子: https://v2ex.com/t/1007499
dongtingyue
2024-01-10 15:13:44 +08:00
RAID 是规避硬件故障, 始数据盘中文件部分损坏 硬盘坏道会引起。idc 服务器用的就是 raid 卡组,5 就够有坏换一个盘自动重建。
zxz1007
2024-01-10 17:24:37 +08:00
实践才是检验问题的好办法,我自己 2007 开始用 RAID5 后转 RAIDZ ,前后 17 年,期间遇到过 2 次磁盘损毁,没有丢失一次数据。
实际上大部分丢数据都是因为认为操作不当,只要你在灾害恢复时有清晰的思路 RAID 是完全没有问题的。况且现在主流的 NAS 系统都带 snap 功能,合适的配置后完全能抵御误删,病毒等问题。
catamaran
2024-01-10 19:09:21 +08:00
前单位遇到过一次事故,raid 硬盘同时全毁,你能信吗?
wanguorui123
2024-01-10 19:36:34 +08:00
等硬盘坏掉时候就知道 RAID 到底有没有必要了,还有就是 IDC 都是 RAID10 起步有条件会做异地容灾,其次就是硬件 RAID 卡一般都有静默纠错功能
YsHaNg
2024-01-10 21:28:40 +08:00
@gdbeixi 这个之前有讨论过 https://note.lishouzhong.com/article/wiki/%E7%BE%A4%E6%99%96%E7%9B%B8%E5%85%B3.html
mdadm 有冗余的情况下 btrfs 才会 self healing 单盘只检查不修复 raid1 有可能因为 lvm load balance 不修复从盘 bit rot 主盘一定修复 raid5 以上一定都修复 但是群晖内核太老 btrfs raid5 还不在 stable 状态 有写入黑洞问题
xzaf
2024-01-10 21:32:12 +08:00
真的重要数据,应该是多套方案来保整尽量安全。

我没什么重要数据,但我的小姐姐们都是 raid1 。
dd102
2024-01-10 21:33:29 +08:00
原来我也是冷备,后天安装套件那个盘告警,迁移好累,我就搞了 2 个 18T 做 RAID1
kujou
2024-01-10 21:46:39 +08:00
@lerry 你这个奇妙的问题我也遇到过,我甚至神经质的思考以后要不要每个文件名末尾都用 MD5 命名呢,同一个文件我甚至出现几分钟前后通过 wifi 传输完 sha1sum 就合不上的事情。虽然很多时候,视频和图片,即使几个字节被更改,一样可以正常使用,但想想就是很膈应人啊。所以我现在很多东西都放在压缩包里,拿出来用也是压缩包然后再解压,因为压缩包自带校验,损坏了至少自己会立刻知道。网盘也不保险,我以前也出现过从网盘下载的数据合不上。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1007363

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX