V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Marelbruim
V2EX  ›  程序员

DORIS BE 频繁宕机 如何排查

  •  
  •   Marelbruim · 52 天前 · 1211 次点击
    这是一个创建于 52 天前的主题,其中的信息可能已经有所发展或是发生改变。

    1.flink-doris 写入任务 到某个内存阈值 be 就挂了 一天能挂几次 但是看使用情况并没有到达百分之八十 还是有很多内存 2.排除任务的问题,已经运行了一年多了 3.我们大裁员裁到大动脉了 我也不太懂这些 有老哥知道怎么排除问题吗 感谢

    12 条回复    2025-05-21 17:20:52 +08:00
    LiaoMatt
        1
    LiaoMatt  
       52 天前
    dmsg 看下 pid 有没有 oom
    Devifish
        2
    Devifish  
       52 天前
    BE 是 java 跑的,CPU 占用这么高目测全是 GC 。 看下 jvm 堆配置的大小
    R77
        3
    R77  
       52 天前
    内存 oom 吧
    lyt001
        4
    lyt001  
       52 天前
    fe 和 be 混布吗?
    把混布的机器 be.conf 的设置内存调小,但是这样 be 不会崩又会导致查询或者导入任务内存不足崩溃
    一劳永逸的办法就是加机器
    zwenooo
        5
    zwenooo  
       51 天前
    把 be 的 crash 日志都上来撒。
    zwenooo
        6
    zwenooo  
       51 天前
    be/log/be.out 里头只有你发的这些吗?再看看
    Marelbruim
        7
    Marelbruim  
    OP
       51 天前
    @LiaoMatt 显示这个
    Marelbruim
        8
    Marelbruim  
    OP
       51 天前
    @wzwmeme #6 是的只有这些 :(
    Marelbruim
        9
    Marelbruim  
    OP
       51 天前
    @lyt001 是混布的 de.conf 调小 不会更容易崩吗
    lyt001
        10
    lyt001  
       51 天前
    @Marelbruim
    所以说一劳永逸的方法是加机器,把 fe 和 be 分开部署
    要是实在加不起机器,那就舍弃 fe 的冗余,只布 1 台 fe ,另外 2 台关掉。
    把留下的那台的 fe 上面的 be 关掉数据转移到其他 be 上去
    lyt001
        11
    lyt001  
       51 天前
    @Marelbruim 拿你的日志问了下 deepseek ,初步判断大概是 compation 分配不到内存空间,be 可用内存不足的问题。
    你的监控页面采集的大概率只是 be 进程占用的内存,但是 fe 占用和系统占用的内存没有计算进去,所以你看内存还有剩余,但是其实已经没有了。
    调小 be.conf 设置的内存值,be 会更保守预估可用内存,减少崩溃的概率,但是会在内存紧张时拒绝一些查询或导入任务,其实也是治标不治本。
    Marelbruim
        12
    Marelbruim  
    OP
       51 天前
    @lyt001 #11 soga 这已经超出我的能力范围了 还是躺平吧
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   866 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 22:05 · PVG 06:05 · LAX 15:05 · JFK 18:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.