首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
V2EX  ›  问与答

ubuntu 18.04 不间断不定时死机

  •  1
     
  •   sulenn · 157 天前 · 3702 次点击
    这是一个创建于 157 天前的主题,其中的信息可能已经有所发展或是发生改变。

    因为工作的原因,我实验室的电脑装的是 ubuntu 18.04.1 系统。但是这个使用体验有点差,不过我也坚持用了半年。有的时候我正在测试代码功能,开了好几个终端,但是突然就嗝屁了。。。让人抓狂。。请大佬帮忙分析一下,十分感激

    1. 症状:

    Ubuntu 系统会不间断不定时死机,现象就是鼠标卡死,键盘操作失灵,按 Ctrl+Alt+Fn 系列按键无法调出文字终端,如果死机时正在播放音乐就会出现音乐在一个点循环播放的问题。每次只能强制重启。。。

    这个症状和 https://www.eefocus.com/fhq1989312/blog/13-02/291658_8d604.html 这个博主的描述超级类似,主要原因是内核版本有问题。但是考虑到博主的系统比较旧 ubuntu 12.04 。所以没有按照该博主的修改方案来做

    我在逛咱们论坛的时候参照了 https://forum.ubuntu.org.cn/viewtopic.php?f=187&t=488711 中的方案,它说造成死机的主要原因是 4.15.0 核心對部份 Intel 顯示晶片的支援有問題。于是我按照步骤将本地的 linux 内核升级到了 4.18.0-15-generic,但还是没有解决这个问题

    2. 本机硬件和其他环境配置

    2.1 sudo cat /etc/os-release

    NAME="Ubuntu"
    VERSION="18.04.2 LTS (Bionic Beaver)"
    ID=ubuntu
    ID_LIKE=debian
    PRETTY_NAME="Ubuntu 18.04.2 LTS"
    VERSION_ID="18.04"
    HOME_URL="https://www.ubuntu.com/"
    SUPPORT_URL="https://help.ubuntu.com/"
    BUG_REPORT_URL="https://bugs.launchpad.net/ubuntu/"
    PRIVACY_POLICY_URL="https://www.ubuntu.com/legal/terms-and-policies/privacy-policy"
    VERSION_CODENAME=bionic
    UBUNTU_CODENAME=bionic
    

    2.2 sudo lshw -numeric -class video

    *-display
    description: VGA compatible controller
    product: Intel Corporation [8086:3E92]
    vendor: Intel Corporation [8086]
    physical id: 2
    bus info: [email protected]:00:02.0
    version: 00
    width: 64 bits
    clock: 33MHz
    capabilities: pciexpress msi pm vga_controller bus_master cap_list rom
    configuration: driver=i915 latency=0
    resources: irq:137 memory:a0000000-a0ffffff memory:90000000-9fffffff ioport:4000(size=64) memory:c0000-dffff
    

    2.3 lsmod | grep -P "(video|drm)"

    drm_kms_helper 172032 1 i915
    drm 458752 7 drm_kms_helper,i915
    fb_sys_fops 16384 1 drm_kms_helper
    syscopyarea 16384 1 drm_kms_helper
    sysfillrect 16384 1 drm_kms_helper
    sysimgblt 16384 1 drm_kms_helper
    video 45056 1 i915
    

    2.4 echo $DESKTOP_SESSION

    ubuntu

    2.5 echo $XDG_SESSION_TYPE

    x11

    2.6 uname -a

    Linux qiubing-MS-7B53 4.18.0-15-generic #16~18.04.1-Ubuntu SMP Thu Feb 7 14:06:04 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux

    3. 其它补充信息

    我个人在本机上除了装一些 ide (如 pycharm、goland、Idea 等)之外,还装了一个仿 mac 的主题,和一些美化用的插件。还有 搜狗输入法、网易云、有道词典之类的软件。不清楚这些东西会不会在一定程度上造成电脑死机。

    刚刚编辑后想发布来着,既然就死机了一会。。。太难受了

    麻烦各位大佬提提意见,再次感谢各位大佬!!万分感谢。

    90 回复  |  直到 2019-05-21 18:16:28 +08:00
        1
    imWBB   157 天前 via Android
    建议不要用 Linux 桌面。
        2
    blankme   157 天前
    我猜猜看,这个电脑内存不超过 4G ?
        3
    changnet   157 天前 via Android
    装 mce log 看内核日志
        4
    changnet   157 天前 via Android
    启动的时候看下 dmesg 有没有什么不兼容,报错之类的
        5
    JackieMe   157 天前 via Android
    看日志了吗? journalctl 看问题体的时候日志是否有什么提示
        6
    superzou   157 天前 via Android
    我的电脑上 听网易云音乐就会死机。只要不开网易云音乐,一点问题都没有。。
    现在都是手机听歌了。。
        7
    hcymk2   157 天前 via Android
    我也有类似的现象,用的是 Ubuntu 16 .原来以为是内存的问题,但是检查后没问题,dmesg 也没有异常,内存 16G
        8
    sulenn   157 天前
    @superzou 我不开网易云音乐也会不定时 死机。。。
        9
    sulenn   157 天前
    @blankme 内存 16 G,cup 是 i7-8700...
        10
    sulenn   157 天前
    @JackieMe 基本上每次出错我都看了日志,并且都有截图。但是在重启系统之前的日志信息基本都是报 “ TCP connection timeout ” 的错误
        11
    sulenn   157 天前
    @hcymk2 那怎么办。。默默隐忍么。。。
        12
    sulenn   157 天前
    @JackieMe 其实我不确定我的判断是不是对的。。不怎么看的懂日志
        13
    shionri   157 天前 via Android
    thinkpad e450 + ubuntu1804 平均一天死一次机(所有按键都不灵,屏幕卡住,有时候多次按电源键能回到登录界面),日志显示蓝牙显卡主板有警告,cpu 日常过热。
    现在换了 dell 就没事了,虽然 cpu 还是日常过热
    原因不明,怀疑是驱动支持和电源管理的问题
        14
    sulenn   157 天前
    @imWBB 不用桌面的话,一下子不能适应过来。。心里总是感觉不方便。。
        15
    hcymk2   157 天前 via Android
    电脑换过一次主板,之后就有这样的问题,但是主板检测说是没问题的。
        16
    sulenn   157 天前
    @changnet 应该是没有的问题的,我之前看过。。但是不排除我没有看懂。。。难受呀
        17
    sulenn   157 天前
    @shionri 感谢经验分享。
        18
    sulenn   157 天前
    @hcymk2 那这个问题有解决么。。
        19
    JackieMe   157 天前 via Android
    猜一下,你把搜狗之类的国内的这几个东西卸载掉试试看。另外你可以看看家目录的 .xsession-errors
        20
    woscaizi   157 天前 via iPhone
    看起来像是驱动问题,建议重装
        21
    hcymk2   157 天前 via Android
    没有啊解决。星期一试下升级内核。
        22
    ochatokori   157 天前 via Android
    如果用的开源驱动,换成成闭源的驱动试试?
        23
    youngxu   157 天前 via Android
    一般这种无故死机且软硬件毫无响应的,很有可能是驱动问题,哪怕是键盘鼠标这种,我的 deepin 不接外设可以用一整天都没事,但是如果接了键盘 /无线鼠标(现在还没查出是哪个)就有一定概率发生这种死机,reisub 都没用
        24
    ooxxcc   157 天前
    开 netconsole,另开一台机器接受

    至少要看一下 dying message,忙猜解决不了问题
        25
    jtnwm   157 天前 via Android
    内核崩溃了,没有日志只能猜。可以换个版本的 Ubuntu 试试。也许新版本内核修复了这个问题。
        26
    ooxxcc   157 天前
    先看一下 journalctl -k -xe -b -1 看一下,如果没有异常说明 FS 在卡死之前已经挂了,那就试一下 netconsole

    至少要确定哪里崩了才好解决
        27
    sulenn   157 天前
    @woscaizi 重装又要配置和安装好多东西。。想哭。
        28
    shm7   157 天前 via iPhone
    桌面系统…用 macos 吧
        29
    love   157 天前 via Android
    显卡驱动,x 相关可能性比较大
    我用了 10 年 arch 桌面只碰到过一回,随机死机,死的时候键盘灯会灭掉,感觉有点像人死如灯灭。回滚显示相关软件后就好了,然后两个月不滚,后来滚过去也没事了。
        30
    sulenn   157 天前
    @love 回滚显示相关软件是啥意思。。。对了,我电脑没有装独显
        31
    saluton   157 天前
    我电脑用了一年多了吧,也是这个毛病,不间断卡死,有时隔一两天,有时一天两次,原因不明
    卡死症状和楼主一模一样
    版本从 Ubuntu 18.04 一路升到 19.04 都没解决
    i7-6700 + 16GB
    现在内核是:5.0.0-14-generic
    uptime:14 days
    最近好像好了一点,十多天才崩溃一次吧,已经放弃了
        32
    zhangxs1989   157 天前
    我的一直这样,无解。
    最近换了 lxqt 桌面的 Lubuntu 基本上算是好了
        33
    sulenn   157 天前
    @JackieMe 我家目录里面没有 .xsession-errors 诶。。
        34
    sulenn   157 天前
    @saluton 感谢经验分享!看来就是硬抗了。。哎。
        35
    sulenn   157 天前
    @woscaizi 重装启动么?
        36
    dandycheung   157 天前 via iPhone
    别花精力折腾了,显卡问题,基本无解。
        37
    sulenn   157 天前
    @ooxxcc 我分别用 journalctl -k -xe -b -1 | grep "error" 和 journalctl -k -xe -b -1 | grep "fail" 试了一下,返回的信息分别为:

    5 月 18 09:02:29 qiubing-MS-7B53 kernel: EXT4-fs (nvme0n1p2): re-mounted. Opts: errors=remount-ro
    5 月 18 09:02:50 qiubing-MS-7B53 kernel: gsettings-data-[2708]: segfault at 48 ip 00007fd151b5605b sp 00007ffe47162930 error 4 in libgconf-2.so.4.1.5[7fd151b38000+2e000]
    5 月 18 09:02:50 qiubing-MS-7B53 kernel: gsettings-data-[2797]: segfault at 48 ip 00007f65d094805b sp 00007ffd52863760 error 4 in libgconf-2.so.4.1.5[7f65d092a000+2e000]

    以及:

    5 月 18 09:02:29 qiubing-MS-7B53 kernel: [drm] failed to retrieve link info, disabling eDP
    5 月 18 09:02:36 qiubing-MS-7B53 kernel: vmmon: module verification failed: signature and/or required key missing - tainting kernel

    google 了一下,没有看懂是啥意思。。。
        38
    sulenn   157 天前
    @dandycheung 我没有独显诶。。是核显的原因么?
        39
    sulenn   157 天前
    @zhangxs1989 感谢经验建议分享
        40
    jakehu   157 天前
    Ubuntu 用了 3 年在 16.04 升 18.04 的时候失败了,遂换了 deepin ;现在用了 1 年多的 deepin 还比较稳定,主要是自带 wine 腾讯全家桶,之前用 Ubuntu 都是开 xp 虚拟机比较麻烦
        41
    ooxxcc   157 天前
    @sulenn 不要 grep,看输出最后的内容,你这些看起来都和问题无关
        42
    ooxxcc   157 天前
    @sulenn -1 是上次启动,以此类推,看你在死机出现之后有几次重启
        43
    sulenn   157 天前
    @ooxxcc -8 的时候显示不可用 `Data from the specified boot (-8) is not available: No such boot ID in journal`。此外,如果不用 grep 的话,1000 行左右的内容。。。这咋用肉眼来看。。
        44
    ooxxcc   157 天前
    因为加了-xe 所以会带 pager 和自动翻到页底,你要是不知道怎么看就贴 pastebin 好了

    另外要是确实没有 crash log 可能是 FS 在内核 panic 之前就挂了,需要设置 netconsole,然后另找一台机器接收
        45
    jackmod   157 天前
    完全卡死的问题在 18.04.alpha 版上见过,然而没有串口,得不到内核信息,各种懵逼(
        46
    dandycheung   157 天前 via iPhone
    @sulenn 核显也会有问题的,只是概率低而已。
        47
    winglight2016   157 天前
    我之前碰到过频繁死机的问题( ubuntu18.10 ),后来发现是因为设置了 bios 里超频工作到 5G,改了之后就再也没死机过了
        48
    zro   157 天前
    是不是开着 Chrome...

    我遇到的就是 Chrome 开着会死,可能这只是个表象吧~~
        49
    sulenn   157 天前
    @zro Chrome 倒是一直开着,因为刚需。。。
        50
    cyh1997   157 天前 via Android
    我升级成 19.04 后一用 wps 时间一长桌面就卡的要死,看资源管理器是 CPU 占用率高。。。也不知道什么原因
        51
    zro   157 天前
    @sulenn #49 地址栏长按回退键试试。。
        52
    sulenn   157 天前
    @zro 我的 cpu 是 i7 - 8700,主板是微星 B360M,这块主板好像是不支持超频的。。
        53
    sulenn   157 天前
    @jackmod 我也是拿不到内核信息。。。就很烦。
        54
    wwhc   157 天前
    在 Gentoo 桌面环境下,一般不会出现这种问题,如果有类似的问题,除了查系统的 log(dmesg/messages)外,还要查桌面环境的 log,如 Xorg.x.log ,都在 /var/log 里
        55
    davie   157 天前 via Android
    据说是 gnome 内存泄漏 换别的系统吧
        56
    steelz   157 天前
    持续关注, ubuntu 18.04.03, 8700+32G+AMD 560x 显卡, 也是不定时卡死.
    貌似用集成显卡没这个问题, 同事装了 AMD 的显卡会有问题
        57
    amazingrise   157 天前 via Android
    同持续关注。我之前用 Ubuntu 也是一样的症状。有的时候是因为内存满了,但是有的时候也不是。而且最骚的是也没有什么日志可查。从 Gnome 换到 xfce,也没什么用。后来我被迫换了 manjaro,除了睡眠有点问题之外都还好。
        58
    wwhc   157 天前
    有时桌面环境崩溃,但仍可通过其它机器 ssh 登录,这样就比较容易排查了
        59
    anyele   157 天前 via Android
    Linux 桌面版就不要折腾了
        60
    orm   156 天前 via iPhone
    sudo journal -xe
        61
    jasonyang9   156 天前
    做几个其它系统的 LiveUSB 跑了试试,进 X 或不进 X,Wayland 或不 Wayland,跑时间长一点,如果还是会随机死掉,那就是其它方面的问题咯

    另外 U 是什么型号的?我遇到过 Intel Bay Trail 平台有个问题会随机死的
        62
    sulenn   156 天前
    @wwhc 好的好的,I get it !感谢
        63
    sulenn   156 天前
    @orm 我试了一下,该命令显示的基本上都是一些重复的日志内容。我从里面截取了非重复的部分,大致包括:
    5 月 19 08:13:32 qiubing-MS-7B53 google-chrome.desktop[24366]: [24366:24436:0519/081332.744898:ERROR:socket_stream.cc(219)] Closing stream with result -2
    5 月 19 08:15:22 qiubing-MS-7B53 nohup.desktop[24358]: Connecting encrypted-tbn0.gstatic.com:443 from 127.0.0.1:55798
    5 月 19 08:15:42 qiubing-MS-7B53 google-chrome.desktop[24366]: [24366:24436:0519/081542.250843:ERROR:connection_factory_impl.cc(413)] Failed to connect to MCS
    5 月 19 08:17:01 qiubing-MS-7B53 CRON[26502]: pam_unix(cron:session): session opened for user root by (uid=0)
    5 月 19 08:17:01 qiubing-MS-7B53 CRON[26503]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
    5 月 19 08:17:01 qiubing-MS-7B53 CRON[26502]: pam_unix(cron:session): session closed for user root
    5 月 19 08:21:11 qiubing-MS-7B53 google-chrome.desktop[24366]: [24366:24436:0519/082111.593429:ERROR:socket_stream.cc(219)] Closing stream with result -2
    5 月 19 08:34:53 qiubing-MS-7B53 nohup.desktop[24358]: AEAD data chunk is incomplete (too small for payload)
    5 月 19 08:30:58 qiubing-MS-7B53 nohup.desktop[24358]: Remote socket: The remote host closed the connection
    5 月 19 08:31:19 qiubing-MS-7B53 gnome-shell[24182]: JS ERROR: Exception in callback for signal: position-changed: TypeError: this._rect is null
    [email protected]:///org/gnome/shell/ui/keyboard.js:561:22
    [email protected]:///org/gnome/gjs/modules/_legacy.js:82:22
    [email protected]:///org/gnome/shell/ui/keyboard.js:643:20
    [email protected]:///org/gnome/gjs/modules/_legacy.js:82:22
    [email protected]:///org/gnome/gjs/modules/signals.js:128:27
    _setCurrentWindow/this._currentWindowPositionId<@resource:///org/gnome/shell/ui/keyboard.js:535:21
    5 月 19 08:34:48 qiubing-MS-7B53 fcitx-ui-sogou-qimpanel.desktop[25057]: libpng warning: iCCP: known incorrect sRGB profile
    5 月 19 08:34:52 qiubing-MS-7B53 nohup.desktop[24358]: Connecting lh3.googleusercontent.com:443 from 127.0.0.1:56046
    5 月 19 08:34:54 qiubing-MS-7B53 nohup.desktop[24358]: AEAD data chunk is incomplete (too small for payload)
    5 月 19 08:35:27 qiubing-MS-7B53 nohup.desktop[24358]: Local socket: The remote host closed the connection
    5 月 19 08:35:27 qiubing-MS-7B53 nohup.desktop[24358]: Connecting clients1.google.com:443 from 127.0.0.1:56086
    5 月 19 08:35:27 qiubing-MS-7B53 nohup.desktop[24358]: AEAD data chunk is incomplete (too small for payload)
    5 月 19 08:35:33 qiubing-MS-7B53 nohup.desktop[24358]: TCP connection timeout.
        64
    sulenn   156 天前
    @jasonyang9 好的好的,感谢。U 是指 CPU 么? 我的 cpu 是 i7-8700
        65
    sulenn   156 天前
    @amazingrise manjaro 不会死机么?
        66
    sulenn   156 天前
    @steelz 我用的就是核显。。没有装独立显卡。。
        67
    sulenn   156 天前
    @wwhc 我这儿 /var/log 下没有桌面环境日志 Xorg.x.log 。。。
        68
    sulenn   156 天前
    @ooxxcc 您好,https://pastebin.com/a06mw2QV 这是 journalctl -k -xe -b -1 命令返回的信息。麻烦您了,我看不懂。。。万分感谢。
        69
    heyjei   156 天前
    如果是 gnome 的桌面的话,正常现象啊,换 xfce4 就好了
        70
    amazingrise   156 天前 via Android
    @sulenn 我这里 manjaro+kde 没有问题。之前内存不够的时候都会卡,后来我加了个内存条 Ubuntu 还是卡。现在如果 lz 没有找到什么查日志的好方法,我建议 lz 逐个排除一下。比如换桌面环境,换成 xfce 看看能否复现。另外建议装一个桌面插件,用来监控内存使用量,记得一定要能显示缓存的那种。或者试试 ssh,然后看一下 top。
        71
    amazingrise   156 天前 via Android
    @sulenn 不过我用 xfce 还是会出问题 。。
        72
    sulenn   156 天前
    @amazingrise 感谢建议。
        73
    sulenn   156 天前
    @heyjei 感谢建议,我试试。
        74
    ech0x   156 天前
    把日志去 Ubuntu 的官方论坛也粘一份吧。
        75
    baelish   156 天前
    曾经出现过, 添加并打开 swap 分区后症状消失, 你可以试试。
        76
    ooxxcc   156 天前
    @sulenn 上次是出了问题再重启的吗,看起来没啥问题啊,而且是正常关机的

    只有一个 tcp 相关的问题,不过应该和你桌面卡死没关系
        77
    ooxxcc   156 天前   ♥ 1
    你确定某一次卡死之后,重启,然后用-1 (上次启动),把日志贴一下

    上上次启动就是-2,以此类推
        78
    sulenn   156 天前
    @ooxxcc 好的,感谢。上次死机我重启后我忘记有没有重启了,我下次遇到死机之后再贴。感谢
        79
    sulenn   155 天前
    @baelish 感谢经验分享
        80
    blindmt   155 天前
    ubuntu18.04 ,之前用 gnome 也是不定期死机,8g 内存加到 16g,swap 从 2g 弄成 16g 都没有什么效果。偶然一次看别人帖子,心血来潮换了 xfce 就没见死过了
        81
    sulenn   155 天前
    @blindmt 感谢经验分享
        82
    sulenn   154 天前
    @ooxxcc https://pastebin.com/p6eu6ZM9,你好我刚刚( 10:03 )的时候电脑突然又死机了,故障和我帖子里面描述的一致。链接中是 journalctl -k -xe -b -1 > file 2>&1 指令输出的内容。麻烦您帮忙看一下,耽误您时间真是不好意思,万分感谢。
        83
    sulenn   154 天前
        84
    ooxxcc   154 天前   ♥ 1
    @sulenn 不过日志里确实没有关于崩溃的信息,说明崩溃发生时 fs 可能已经挂了,至少没有写到日志中

    所以你需要配置 netconsole https://wiki.archlinux.org/index.php/Netconsole_(%E7%AE%80%E4%BD%93%E4%B8%AD%E6%96%87) 用另一台机器接收 kmsg
        85
    sulenn   154 天前
    @ooxxcc 感谢!
        86
    ooxxcc   154 天前
    @sulenn 其实日志没那么难看懂……举个例子 https://fars.ee/1HVI

    从 “------------[ cut here ]------------” 开始就是一个内核模块的崩溃(?)日志,知道原因就可以想办法修复或者绕过,不过如果问题在上游,修复的门槛就很高了……
        87
    sulenn   154 天前
    @ooxxcc 内核模块崩溃的话就大概率会有 ------------[ cut here ]------------ 和 ---[ end trace 8b6e162c8faf4f1c ]--- 来提示用户么?还有就是“问题在上游”是啥意思。。。
        88
    ooxxcc   154 天前
    @sulenn 一般都有类似的结构吧,触发 bug 或者 panic 都会有类似的结构和 Call Trace ……

    问题在上游比如说内核或者显卡驱动有 bug,反正我是没法修的……
        89
    sulenn   154 天前
    @ooxxcc 感谢!!!
        90
    sulenn   154 天前
    @ooxxcc 好的好的。学习到了。
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   929 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 34ms · UTC 22:07 · PVG 06:07 · LAX 15:07 · JFK 18:07
    ♥ Do have faith in what you're doing.