linux怎么查看硬件错误

linux中,可以利用mcelog来查看硬件错误;mcelog是用于检查硬件错误的工具,可根据错误导致的热重启或硬重启来获取错误,热重启的错误信息会被捕获到,硬重启的错误捕获不到,可用“yum install mcelog”命令进行安装。

linux怎么查看硬件错误

本教程操作环境:linux7.3系统、Dell G3电脑。

linux怎么查看硬件错误

1、mcelog 是Linux 系统上用来检查硬件错误,特别是内存和CPU错误的工具。

未纠正的错误是关键异常,如果 CPU 无法恢复,往往会导致系统上的内核错误。这会导致应用程序重置和中断。

对于未纠正的错误,mcelog捕获错误的能力取决于错误导致热重启还是硬重启。

如果是热重启,信息会被 mcelog 捕获,恢复后可看到。硬重启会导致数据丢失,而且 mcelog 可能捕获不到该事件。

2、安装

 [root@RedHat_test ~]# yum install mcelog.x86_64

3、mcelog的启动方式

  • cron : 最老的方式,有确定,定时任务,会丢失一些

  • daemon : el7上用这种,守护进程的方式

  • trigger : 高级一点的方式,触发的时候,看man mcelog

4、mcelog相关文件

  • /dev/mcelog 设备文件

  • /var/log/mcelog messages日志文件

  • /etc/mcelog/mcelog.conf配置文件

  • /var/run/mcelog.pid

默认故障日志只记录在/var/log/mcelog,并不记录到系统日志中。

如果需要在系统日志中也体现,需修改/etc/mcelog/mcelog.conf文件,将前面#去掉,并保存。

5、mcelog后台运行

 [root@RedHat_test ~]# mcelog --daemon

6、查看系统是否异常

1.手动运行mcelog的方式

 [root@RedHat_test ~]# mcelog --daemon

2.查看mcelog日志

     [root@RedHat_test ~]# tail /var/log/mcelog
     # 什么也没有输出,表明正常

3.查看mcelog守护进程是否检测到错误信息

     [root@RedHat_test ~]# mcelog --client
     # 什么也没有输出,表明正常

4.解析系统异常时的mcelog输出

   [root@RedHat_test ~]# mcelog --ascii < file.log
     # or或者
     [root@RedHat_test ~]# mcelog --ascii --file file.log

推荐学习:Linux视频教程

以上就是linux怎么查看硬件错误的详细内容,更多请关注其它相关文章!