东芝硬盘是垃圾,奉劝各位不要买。求帮助!

110 天前
 wuyadaxian

我在日本某动画公司工作,因为公司业务需要,需要弄一台大点的 SAMBA 共享服务器。

于是去年年底购入了 16 块,16TB 的 toshiba ,型号 MN08ACA16T/jp 。

日本国内质保 3 年,免费换新。

售后挺好的。但是噩梦来了。


去年 9 月购入,然后装机,上机架,系统设置,一气呵成。

15 盘 RAID10 ,+1 备用盘。合计 109T 可用空间。

然后做了 1 个月测试,没发现问题。

然后将业务数据移动到新服务器上。

正常开始跑业务。

也就是公司内部的作画 psd ,摄影 ae 做影片到处 mov 等数据在传输。


接下来 11 月开始卡了。

各种卡,表现为 smbd 或者 flush 进程 100%。

硬盘 io 全为 0.

甚至 dmesg 都出现内核恐慌了。

分析了下就是写入硬盘,然后没了。

等待 30-300s 随机时间,硬盘写入恢复。

怀疑写入遇到坏块了。

smartctl 测试走起。

好家伙,16 块盘,有 6 块报坏块。


不得不说,日本经销商态度可以。

马上 [私密马赛,私密马赛,私密马赛]

我们给你换。

换货邮费还是经销商全包。

甚至提供先发货,我再退货的服务。


换货之后

陆续小卡,恢复时间很短,基本上 10s 内。

而且 SMART 也不报错,smartctl -t long 测试也能无错通过。

我就放置了。


24 年 1 月 12 日,

又开始了,超级大卡。

这次恢复时间居然超出了 600s ,

所有含写入的进程都在内核恐慌。

dmesg 拉了 300 多行.

关键是这个一卡,公司业务全部要暂停,

硬盘写入读取完全无响应。

同事翘脚抱怨,我就只能打哈哈调试。


之后从 12 日开始到今天 18 日,

每天都有十来次卡顿,

30s-120s 才能恢复。

关键是 SMART 不报错。

日嘛,头都大了。

你要是报错,我就把你提出来找经销商换新啊。

你啥错误都不报,smartctl test 还能正常无错通过。

但是就是卡,简直要了我的狗命。


老板问,为啥服务器又卡了。

我,硬盘可能又坏块,要坏了。

老板,那找厂家换吧。

我,硬盘没报错,暂时还不能保修换新。

老板,你 TM 拿我开心啊,给我去解决这个问题。

我,打工人乖乖退下。


mb 东芝硬盘,

现在虽然偶尔卡顿,但是每天业务还在进行。

我又不能现在卸载硬盘来跑个完整的写入测试。


求问各路大佬有没有什么办法。

任何方法都可以尝试。

真心求问。

5966 次点击
所在节点    硬件
79 条回复
aaniao002
110 天前
感觉像买到 smr 了,用硬盘产品型号那一串查一下,如果是 smr 直接全换了吧。写入量一高各种卡。
lesismal
110 天前
有故障现象就拿去售后,人家没说你用户自己检测不报错就不能售后吧?
wuyadaxian
110 天前
@aaniao002 CMR ,确认过了。买的时候和商家确认了,官网也确认了,第一次保修换新的时候也确认了,就是 CMR 。但是感觉比 SMR 还垃圾
wuyadaxian
110 天前
@lesismal 拆不掉,主业务在上面。只能提供报告,然后对面寄新盘,同时交换了,我再把旧盘发回去。
---
现在让我拆 RAID10,拆一半出去,很慌,我怕刚拆完,另一半的某块盘报坏块了。
wuyadaxian
110 天前
@lesismal 返厂检查至少 2 周起,检查这两周不给备用盘,RAID10 抽走一半,我怕是要 GG
gamexg
110 天前
数据重要不?
重要赶紧买新硬盘替换掉.

另外是不是其它硬件存在问题?
6/16 的故障几率是不是也太离谱了?
电源之类有问题造成硬盘损坏?


要不临时买少量几个其他品牌的盘替换掉目前的盘,然后把替换下来的返厂看看厂家怎么说?
bihui
110 天前
MN08ACA16T/jp 。 我好像买的也是这个
xausky
110 天前
感觉不至于呀,我这国内买的矿渣东芝盘都还挺好的
GooMS
110 天前
检查下硬件把
Pichai
110 天前
我咋看新闻东芝都要把存储业务卖掉了!
Donahue
110 天前
我觉得主要的硬盘厂商 东芝 西数 希捷就这三家吧,问题应该不是东芝,可能受到电源等外部因素影响的,我去年闲鱼买的东芝 14TB 矿渣都没什么问题
northbrunv
110 天前
企业级还得是希捷靠谱啊
shijingshijing
110 天前
东芝的盘是三家里面最稳定的了,建议先还是查看一下电源吧
datou
110 天前
大盘只能买企业盘

TOSHIBA 的企业级是 MG 系列吧

MN 是什么鬼。。。。
MoeWang
110 天前
要不要做做电源纹波测试先
dasenlin
110 天前
看样子是硬盘背锅了,按概率讲,就算是数据中心的使用频率和量,一年左右同时坏 6 块,这个概率是极低的。再说第二次换新后还是无缘由的无响应,你要考虑下服务器硬件或者软件设置上的问题了。
这个样子你再次换新硬盘,还是解决不了问题。
可以先把硬盘替换到新硬件平台排除一下原来平台的问题。
anyinuo0413
110 天前
俩月多 50%的故障率,感觉不是硬盘的问题,检查下机房环境/电源?
再差的盘 故障率也不可能这么高啊…
msg7086
110 天前
@datou MN 是家用级 NAS 盘。

@wuyadaxian 按理说 NAS 系列是不太适合那么多盘放在一个机箱里跑的。企业级才适合这种环境。
比如 Ironwolf 系列只 rate 到 8 块硬盘在一个机箱里跑。
hGaHLRyC
110 天前
16 块盘那么短时间同时 6 块出现坏块,是不是检查下硬盘外的问题啊,比如主板,震动和供电?这比率太高了把?
datou
110 天前
@msg7086 8T 以及 8T 以上非企业盘都是坑小白的

请认准 TOSHIBA MG ,SEAGATE EXOS 和 WDC ULTRASTAR 系列的正统企业级 HDD

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1009748

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX