Linux中日志管理和常见故障(Linux日志常见故障排除和修复)

一、关于日志及管理

1.日志的功能

用于记录系统、程序运行中发生的各种事件

通过阅读日志,有助于诊断和解决系统故障

2.日志文件的分类

内核及系统日志

由系统服务rsyslog统一进行管理,日志格式基本相似

用户日志

记录系统用户登录及退出系统的相关信息

程序日志

由各种应用程序独立管理的日志文件,记录格式不统一

3.日志保存位置

默认位于:/var/log 目录下

4.主要日志文件介绍

/var/log/messages:内核及系统日志
/var/log/cron:计划任务日志
/var/log/dmesg:系统引导日志
/var/log/maillog:邮件系统日志

用户登录日志
/var/log/lastlog:最近的用户登录事件
/var/log/wtmp:用户成功登录、注销及系统开、关机事件,对应命令 last
/var/log/btmp: 用户失败登录,错误验证尝试事件,对应命令 lastb
/var/run/utmp:当前登录的每个用户的详细信息,对应查看命令 users  who  w
/var/log/secure:与用户验证相关的安全性事件

5.日志配置文件

/etc/rsyslog.conf

*.info #任何服务info级别及以上日志

mail.none #例外,不记录

6.日志级别

  • 0 EMERG(紧急/疼痛):会导致主机系统不可用的情况
  • 1 ALERT(警告):必须马上采取措施解决的问题
  • 2 CRIT(严重):比较严重的情况
  • 3 ERR(错误):运行出现错误
  • 4 WARNING(提醒):可能会影响系统功能的事件
  • 5 NOTICE(注意):不会影响系统但值得注意
  • 6 INFO(信息):一般信息
  • 7 DEBUG(调试):程序或系统调试信息等

7.日志一般格式

Jun 3 13:26:35 localhost vmusr[2439]: [critical] [GLib-GObject]

时间标签        主机       子系统名 日志级别和信息

8.程序日志

由相应的应用程序独立进行管理

Web服务:/var/log/httpd/

access_log、error_log

代理服务:/var/log/squid/

access.log、cache.log、

9.分析工具

文本查看、grep过滤检索、Webmin管理套件中查看

awk、sed等文本过滤、格式化编辑工具

Webalizer、Awstats等专用日志分析工具

10.日志管理策略

及时作好备份和归档

延长日志保存期限

控制日志访问权限:日志中可能会包含各类敏感信息,如账户、口令等

集中管理日志:

将服务器的日志文件发到统一的日志文件服务器(ELK)

便于日志信息的统一收集、整理和分析

杜绝日志信息的意外丢失、恶意篡改或删除

图片[1]-Linux中日志管理和常见故障(Linux日志常见故障排除和修复)-不念博客

二、常见故障

1、MBR故障修复

Mbr扇区

引导程序GRUB 446

分区表 64

结束标志 2

故障原因

病毒、木马等造成的破坏

不正确的分区操作、磁盘读写误操作

故障现象

找不到引导程序,启动中断

无法加载操作系统,开机后黑屏

解决思路

应提前作好备份文件

以 CentOS 7安装光盘引导进入急救模式

从备份文件中恢复

2、GRUB 引导故障

故障原因

MBR 中的 GRUB 引导程序遭到破坏

grub.conf 文件丢失、引导配置有误

故障现象

系统引导停滞,显示“grub>” 提示符

解决思路

尝试手动输入引导命令

进入急救模式,重写或者从备份中恢复 grub.conf

向 MBR 扇区中重建 grub 程序

3、修复文件系统

故障原因

非正常关机、突然断电、设备读写失误等

文件系统的超级块(super-block)信息被破坏

故障现象

无法向分区中读取或写入数据

启动后提示“Give root password for maintenance”

解决思路

根据提示输入 root 口令,进入修复状态

使用xfs_repair命令进行修复

4、硬盘i节点耗尽

故障原因

磁盘空间已被大量的数据占满,空间耗尽

虽然还有可用空间,但文件数i节点耗尽

故障现象

无法写入新的文件,提示“… : 设备上没有空间”

部分程序无法运行,甚至系统无法启动

解决思路

清理磁盘空间,删除无用、冗余的文件

转移或删除占用大量 i 节点的琐碎文件

进入急救模式进行修复

为用户设置磁盘配额

5、磁盘坏道

故障原因

磁盘设备中存在坏道(逻辑的或物理的)

故障现象

读取磁盘中的数据时,磁盘设备发出异常声响。

访问磁盘中的某个文件时,反复读取且出错,提示文件损坏

对于新建立的分区无法完成格式化

系统使用该磁盘时频繁死机

解决思路

检测硬盘中是否存在坏道

修复硬盘,或更换新的硬盘

© 版权声明
THE END