学校超算管理员匆忙上线 CentOS 8 结果翻车了

2021-03-22 12:44:39 +08:00
 xuegy

最近学校大跃进式把所有超算节点从 7 升级到 8 了,结果大翻车。

系统升级完,第一件事当然是登进去重新编译代码。结果新系统居然忘装 nano,没办法先用 vi 改配置文件吧,给管理员发了一个 ticket,10 分钟后回复我装好了,看来新系统装完了还挺闲的。

进 module 里面看看更新了啥,结果也乱套了。原来 CentOS 7 老的 module 还没清理干净,跟新的摆在一起都不知道谁是谁,只能通过版本号猜。(截至发帖时清理的差不多了)

编译的时候 openmpi 也翻车了,找不到libpmi2.so.0。这个应该是属于重大运维事故了吧?管理员在一整天之后才修复,告诉我说是忘记在头节点上编译 pmi 了。上线之前这么基本的组件都不测试一下的吗?

总结经验教训,学校级别的运维水平参差不齐,从 7 升级到 8 翻车是难免的。年底不能白嫖 CentOS 以后肯定得换系统,到时候接着翻车。

11382 次点击
所在节点    Linux
76 条回复
venster
2021-03-22 12:47:10 +08:00
我觉得只要系统能起来,都不算重大事故吧。
imes
2021-03-22 12:48:03 +08:00
明明 centos8 年底就要转 stream 了,这管理员也太胆大了吧,毕竟 7 的 eol 比 8 长,而且 7 也没什么问题啊。
yyyb
2021-03-22 12:49:12 +08:00
哪里的运维都有干活不带脑子的
m4d3bug
2021-03-22 12:51:53 +08:00
事实上,编译的事情你换个 os 也一样后果
Xusually
2021-03-22 12:52:16 +08:00
这波操作看不懂啊?
明明 CentOS 8 的 EOL 就是今年年底了。CentOS 7 可以到 2024 年。
xuegy
2021-03-22 12:52:38 +08:00
@venster 超算几乎没有不用 mpi 的,mpi 用不了跟系统起不来没啥区别。
venster
2021-03-22 12:54:18 +08:00
@xuegy 不懂了,隔行如隔山
sadfQED2
2021-03-22 12:54:41 +08:00
这么前卫吗,我司线上还是 centos4,从来没有谁提过要升级
matolv
2021-03-22 12:58:55 +08:00
你校运维不看看新闻?为何要 49 年入国军?不过 centos 8 转 centos 8 stream 也就 3 行代码。只是 centos 8 stream eol 和 centos7 一样,都是 2024 年。
xuegy
2021-03-22 13:01:40 +08:00
@matolv 好像最新的新闻是 RHEL 对非营利组织免费
m4d3bug
2021-03-22 13:02:30 +08:00
@xuegy 开发者订阅对所有人免费,你们又不是商用环境
zengxs
2021-03-22 14:04:34 +08:00
centos 8 到 oracle linux, rocky linux, almalinux 这些都是有一键切换脚本的,基本上算是可以无缝切换吧,也不算特别大的事
chenqh
2021-03-22 14:32:44 +08:00
@sadfQED2 centos4 我有点不信呀
Lee2019
2021-03-22 14:40:53 +08:00
centos7 没必要上 8 吧
你们的运维老哥是闲着没事干了吗
还是他的 kpi 就是每年升级几次操作系统
wtks1
2021-03-22 14:45:09 +08:00
@chenqh 俺们的生产环境里还有 win2003 来着....
LokiSharp
2021-03-22 14:50:41 +08:00
不翻几次车怎么体现运维工作的重要性(滑稽
ReZer0
2021-03-22 14:54:11 +08:00
我的个人经验是,只要稳定跑,就不去搞升级。除非当前环境满足不了需求了才考虑升级,否则坚决不升。(手动斜眼
Ansen
2021-03-22 15:09:16 +08:00
换 ubuntu 2004?
tabris17
2021-03-22 15:09:44 +08:00
@Xusually 没有 KPI 制造 KPI 也要上
swulling
2021-03-22 15:11:04 +08:00
CentOS 7 真的足够了,如果采购的集群是 8,那就降级到 7 就好了。

依赖尽量通过 Container 来解决,没必要动基本系统。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/763914

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX