某五百强信创数据库运维幽默记录

2024-04-26 10:53:05 +08:00
 HOMO114514
某五百强信创数据库,为了搭配他们的 arm 硬件,把物理安装的配置需求设计得十分严格,核数内存比 1:8 ,至少 8C 起步,否则安装检查不通过。

(但是容器化模式下允许 4C16G 安装)

一个集群 3 节点,也就是每个 cluster 至少要吃掉 24C192GB 内存,我们这边 base 的机器资源不够,调动用外地的机器,两地之间网络全隔离,需要开单申请端口放行

开始之前,我问某五百强技术支持,我们网络隔离,完成任务 1 需要开通什么端口

技术支持丢给我一个《端口矩阵》,林林总总列出了所有组件的端口接近 100 个,但是没告诉我是干什么用的,说可以参考这个文档

然后选了几个看起来要用的端口,提交了审批,等了 2 天,端口批下来了开始干任务 1

卡住了,几百个组件查 log 查了俩小时,发现它在任务过程中冷不丁地要请求一个端口 A 才能完成,具体来说,它下发 agent 包用的不是 scp ,而是要求 node 反过来请求 controller 的自建非标端口 sftp

OK ,反馈,继续开审批,然后追问五百强技术支持,你们任务 1 还涉及什么端口能说说吗?任务流程全是黑盒子,使用手册没有、矩阵文档也没有

技术支持说,你看看端口矩阵,自己整理下

OK ,等了 2 天,端口 A 批完了,继续任务 1 ,结果卡在另一个地方,再查俩小时 log ,发现这个子任务靠 ping 判断 node 的网络连接,但我们没开 ICMP

OK ,继续开审批,把 ICMP 开了,我再追问技术支持,你们还有什么端口要访问的,能不能说清楚

他回答我,那个端口矩阵你可以看下

等了 2 天,ICMP 批下来了,继续任务 1 ,结果卡在最后一个子任务,这个任务在矩阵文档里写的是要用端口 B ,之前已经批过这个端口,测试也顺利放行。

继续查 log 和测试,俩小时之后发现这个子任务实际上在用端口 C ,而非 B ,端口 C 没开通

OK ,继续开审批,等了 2 天,把端口 C 开了,最后终于跑完了

半个月时间消失了

接下来做任务 2 ,毫无意外地卡住了

查 log 两小时,发现这个子任务试图让 node 终端请求 controller 的 Kafka 来获取一些任务参数,这个端口当然是没开通的,哥们,你是个数据库啊

反馈技术支持,追问,你们任务 2 要什么端口

技术支持进入了已读不回状态
14164 次点击
所在节点    程序员
99 条回复
levelworm
2024-04-26 11:42:27 +08:00
@seers 这些数据库怎么这个样子?国内的那些也是如此吗?
2xvaHoK2LGxQ29R5
2024-04-26 11:53:24 +08:00
arm 的 aarch64 64k pagesize 可能 是一个原因
LieEar
2024-04-26 11:58:37 +08:00
他这个数据库是自己从 0 开始写的吗?还是开源套皮的
HOMO114514
2024-04-26 12:01:46 +08:00
@NessajCN
这家五百强的风格是为每个项目指派一个专门负责人对接支持,无论是 poc 还是正式交付的项目,从程序上来说是挺好的
但架不住已读不回的就是这位负责人
HOMO114514
2024-04-26 12:02:52 +08:00
@seers
吃一堑长一智,以后会这么干了
jinsongzhao
2024-04-26 12:26:19 +08:00
其实不用关心是否套皮,关心一下哪些能超越的,超不过就赶紧加入,努力成为那个没了我,你也要完蛋的加入者。
vagusss
2024-04-26 13:42:45 +08:00
已读不回, 直接向上反馈说不配合, 花了钱还遭罪这家也太牛了.
totoro52
2024-04-26 14:07:34 +08:00
@LieEar 信创基本是套皮,没几个是自己的
totoro52
2024-04-26 14:08:24 +08:00
“发现这个子任务试图让 node 终端请求 controller 的 Kafka 来获取一些任务参数”
一个数据库为什么还需要 Kafka 。。。 好奇
1018ji
2024-04-26 14:11:44 +08:00
话说你是咋想的敢问第二次呢
dacapoday
2024-04-26 14:28:21 +08:00
特有的客户当孙子,信创,腐败的温床。
lltlo
2024-04-26 14:32:03 +08:00
@vagusss 下回可能就是不读了
huzhizhao
2024-04-26 14:34:48 +08:00
信创项目嘛 设计是这样的
HusaYn
2024-04-26 14:37:12 +08:00
好日子还在后头呢
yeyang5211
2024-04-26 14:46:57 +08:00
@dacapoday 我只能说确实挣钱,这孙子不白当.. 有专门的信创拨款
fengye0509
2024-04-26 14:49:38 +08:00
@chowdpa02k413 #4 我觉得第一次卡住 你再去提审批就该考虑一下,这个技术提供的端口矩阵不准确,需要你来沟通和测试后完善一下再去申请新的,永远不要相信别人提供的
dif
2024-04-26 15:09:31 +08:00
@povsister 那卖的是产品吗?卖的是人情世故。 虽然觉得这些软件恶心。
leaflxh
2024-04-26 15:09:51 +08:00
烂先不谈,以后别炸就行。炸了那可真是搬起石头砸自己的脚
mark2025
2024-04-26 15:20:19 +08:00
还有更幽默的的 vx 公众号 人在信创
az467
2024-04-26 15:21:20 +08:00
某几家的产品,
说是信创数据库,其实是基于 pgxl 架构改出来的缝合产物,还自带运维平台,不是通常意义上的单纯数据库。

所以不但有 kafka ,甚至还可能有 redis ,zookeeper ,es 等等一堆东西。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1035840

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX