生产环境故障该不该追责员工

2019-06-20 14:21:18 +08:00
 Sothoth

在 SRE 的世界里,有个概念叫做“事后无过失”( blameless postmortem ),这是一种回顾过去所犯错误的方式,但不会将责任归咎于任何人。在谷歌工作了近 5 年的隐私工程师塔里克·尤素福(Tariq Yusuf)表示:“这是谷歌文化的一个基本组成部分,也是让人能够大胆剖析出问题的能力。但报复消除了能够安全提出问题的核心阻碍,整个过程因此而崩溃。”

———— https://www.cnbeta.com/articles/tech/859031.htm 谷歌"内战":高管要利润,员工要价值观,谁是灵魂?

大部分公司应该都会追责吧 即使没有相关处罚 各种潜在影响(绩效 KPI...)也是避免不了吧 想听听大佬们的意见 也想了解下大厂的处理方式

12713 次点击
所在节点    程序员
90 条回复
SimonOne
2019-06-21 09:54:25 +08:00
@troywinter #7 一年 52 周啊,那就是一年要造成几百万*52,五千万-五亿损失 /年,这关系也太硬了吧。
zhttty
2019-06-21 10:00:07 +08:00
不按流程规范、执行要求做事,自己犯得低级错误当然要追责到人,譬如强调严禁直接操作生产环境数据库,你还这么搞,出了问题当然要。
CantSee
2019-06-21 10:01:22 +08:00
有的技术领导一出问题先拉出去个挨子弹的,之前我们公司就有,某银行,给签约商户结算多结算了几百万,最后负责这个地方的同事被开除了;还说什么引咎辞职,最后是公司框架的故障!渍渍
Ritr
2019-06-21 10:05:48 +08:00
@tigerstudent 风险共担,利益共享
Dex7er
2019-06-21 10:15:30 +08:00
看你是要解决问题,还是要解决无意之中制造出问题的人了。
解决问题么就事论事,谁拿的最多谁担最大的责任。
解决人,最后无非就是从团队里面找一个倒霉的背锅侠罢了。

然后,大家就一起战战兢兢地保守下去呗。少干少错,多干多错。
再然后,你就发现大家的工作积极性怎么搞都提不高,为什么呢?

小到几行代码,大到航空航天原子能,
哪个行业有不犯错的人?有不犯错的工作?

不遵守既定规则,那不叫犯错,那叫犯规。。。
chmlai
2019-06-21 10:29:39 +08:00
大部分公司本身就是有限责任的, 再说公司就是用来共担风险的
yiyi11
2019-06-21 10:40:50 +08:00
参照日本瑞穗证券因为系统 bug 导致 400 亿损失的事件。证券公司告 it 公司,本案核心点之一:什么样的 bug 才算是“重大过失”?法院给出了判断的标准——这个 bug 是不是很容易被发现。

如果员工尽了责任去做,但是由于复杂度的问题,依然有难以预见的风险发生,这也是没办法的事情。
cuikai1
2019-06-21 11:12:47 +08:00
@fxxkgw 好奇十万分之一是怎么算出来的?
lazyfighter
2019-06-21 11:30:35 +08:00
恢复、定级、影响 kpi
blackboom
2019-06-21 11:57:31 +08:00
不考虑故障场景的情况下,优先找领导。
troywinter
2019-06-21 12:09:48 +08:00
@SimonOne 嗯,他工作经验多,又曾经是淘宝资深员工,领导比较信任他,好在后来那个服务越来越好了,没有继续烂下去。
realpg
2019-06-21 12:15:08 +08:00
写代码写出 bug 之类应该是不算过失的

不遵守规程操作之类导致后果 是一定要追责的
yy77
2019-06-21 12:18:44 +08:00
程序正义啊。按既有规章制度流程走了,就不该追责;不按规章制度流程走导致损失的,那就要罚。但是肯定不能把所有关联损失都罚进去。
lucifer9
2019-06-21 12:39:07 +08:00
大公司不一定是要具体员工承担责任,但是肯定要打到某个部门头上
话说当年我们写故障报告很重要的一点就是要猜对这次领导想让哪个部门背锅
否则写一万次都得打回重写
iyaozhen
2019-06-21 12:42:40 +08:00
当然先解决问题,事后肯定要复盘,大事故就得追责了。

一般是当事人到一层层经理到总监都得罚款。听说我们总监有个月罚了小几万,
人为因素还会辞退
wxl1380610
2019-06-21 12:54:08 +08:00
@Myprincess 20 万 随时 赔两万块 我就想说 那个员工现在还在吗 ?
loryyang
2019-06-21 12:58:03 +08:00
看当时操作是否违规了,如果违规,那基本是完蛋了。如果没有违规,那么问题还行,短期绩效肯定会受影响,但是长时间看,还行
qiumaoyuan
2019-06-21 12:58:31 +08:00
所有类似的事情都一样:领导责任最大。
LokiSharp
2019-06-21 12:59:52 +08:00
指定公司 ISO 质量体系啊啊
tourist2018
2019-06-21 13:52:31 +08:00
个人怎么负责 百度微信这种宕机了 损失不是个人能赔得起的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/575828

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX