V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
weishao666
V2EX  ›  Linux

UOS 执行 bash 137 退出,无排查思路

  •  
  •   weishao666 · 176 天前 · 869 次点击
    这是一个创建于 176 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我们在用 uos 的操作系统跑一些任务,cpu 消耗型,进程被操作系统干掉了,137 的退出码,但我们内存消耗很低,操作系统日志看不到任何错误信息,更别谈 OOM 了,请问有大佬能指导下怎么排查么?

    11-02 20:04:44 [b152f9869d464b599c299bd152616354] [local] [threadPoolTaskExecutor-122] INFO -- exec result: ShellResult(exitStatus=137, out=command terminated with exit code 137)

    查了节点 kubelet ,containerd ,/var/log/message 都没有有效的日志,没有头绪

    服务器有 80 核 128G

    7 条回复    2023-11-04 12:53:05 +08:00
    blackeeper
        1
    blackeeper  
       176 天前
    看 resources.limits
    julyclyde
        2
    julyclyde  
       176 天前
    137 是信号 9 啊
    BG7ZAG
        3
    BG7ZAG  
       176 天前
    用 uos 的专业版还是免费版?专业版直接去找他们技术。免费版也可以去 deepin 问题问问~
    waringid
        4
    waringid  
       175 天前
    11-02 20:04:44 [b152f9869d464b599c299bd152616354] [local] [threadPoolTaskExecutor-122] INFO -- exec result: ShellResult(exitStatus=137, out=command terminated with exit code 137)

    这个线程退出提示的内容是容器里面的吧?容器里面的 Shell 退出要定位到具体的容器,通过容器内部的信息定位确认。在主机层面是很难定位容器内部应用的错误的
    devopsdogdog
        5
    devopsdogdog  
       175 天前
    zombie 都有 9 个了, 被系统干掉了,要么就是大量资源没有释放,要么就是你任务太多不够用了,随机杀了一些经常,pod 应该有日志 或者事件吧
    devopsdogdog
        6
    devopsdogdog  
       175 天前
    补一点 查看系统进程 和 线程数量 ,目测你的有点多 都 2000 多个了
    julyclyde
        7
    julyclyde  
       175 天前
    @waringid 我也觉得 threadPoolTaskExecutor 应该是编程库的输出,不是内核的输出
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1171 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 23:32 · PVG 07:32 · LAX 16:32 · JFK 19:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.