读隔壁部门代码发现的骚操作

2023-05-09 10:41:00 +08:00
 bugmakerxs

入口是一个 shell 脚本,内容大概如下:

python a.py > $CUR_DIR/step1_$date.txt
python b.py < $CUR_DIR/step1_$date.txt > $CUR_DIR/step2_$date.txt
python c.py < $CUR_DIR/step2_$date.txt > $CUR_DIR/step3_$date.txt
python d.py < $CUR_DIR/step3_$date.txt > $CUR_DIR/step4_$date.txt
python e.py < $CUR_DIR/step4_$date.txt > $CUR_DIR/step5_$date.txt
python write_es.py < $CUR_DIR/step5_$date.txt

一个个 txt 看入参出参,一个个脚本看处理过程,有点不适应

1901 次点击
所在节点    程序员
6 条回复
winglight2016
2023-05-09 12:19:33 +08:00
这是基于 shell 的 pipeline 呀
rizon
2023-05-09 12:19:54 +08:00
流式数据处理
全链路可调试追踪
(狗头)
v2wtf
2023-05-09 12:27:09 +08:00
不管他是有意的还是无意的做到的,其实这是非常好的用法,整个过程可以人肉监控、复查,如果其中有一步出错了,那么可以手动去重新执行出错的那步和后续步骤(相当于断点续传)。

这个做法在执行一些需要非常久的时间数据处理操作的时候非常之好用。
yuruizhe
2023-05-09 12:32:24 +08:00
挺好的,按步骤记录中间结果,除了有点费硬盘和 io 时间
burymme11
2023-05-09 18:26:58 +08:00
等出问题的时候,你会爱死这些 txt 的。
fox0001
2023-05-09 21:06:41 +08:00
要检测中间结果,还不如写 log…

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/938514

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX