aix 报错有些不明白问题出在哪

   在外面煎熬了四天今儿一回单位就赶上出事儿。

    报用户过期奇怪,我们这边的机器从来不设置用户期的以为是密码过期,用系统盘启到service模式下,passwd,重试仍然不行。

下媔的root段里面加入了rlogin=false,当时心里就有点疑惑:“rlogin是控制远程telnet和rlogin的,现在的情况是本地都无法用root用户登入”但既然有人投案了,就试试看呗

改user文件也要root来改,root登不进去还得重启进维护模式,进去后检查了expires, maxage以及maxexpired得设置都没有问题,在root一段下面删除rlogin=false,重启仍不成。

    冷静下来仔细看了一下,root字段和之后的daemon字段中间少了一个空行本来应该是:

    想必那孙子不懂,加完rlogin,看下边一行空格不顺眼顺手删了,这就是所谓的多行不义必自毙了~~咬牙切齿ing:浪费我一个多小时的花样年华

ps:配置文件的格式真的很重要,之前做过一个AIX audit的方案老是出诡异的差错,最后也是在配置文件的对齐上查出问题

加载中,请稍候......

}

为了规范故障维护步骤简化维護过程,编写本手册以供参考由于AIX故障种类多,不能一一列举这里简单介绍部分故障判断,定位解决方法。

  • 弄清楚系统发生了什么問题 

  • 系统现在能做什么?不能做什么 

  • 故障什么时候发生的? 

  • 有没有做平时不同的操作 

  • 故障有没有规律?定时还是不定时发生的频率有多高? 

  • 是一台机器出现故障还是多台机器故障故障现象是否相同? 

  • 最近有没有做改动如安装了新的硬件、软件,改变了系统的一些设置

检查机器是否存在故障 

一般情况下,可以通过以下几种方法来收集错误信息 

1、查看机器各种指示灯状态 

机器上有许多指示灯即时說明机器运行的状态这些指示灯的状态可以作为判断机器是否有故障的一个依据。当指示灯的状态不正常时需要引起注意。比如当機器警告灯亮的时候,一般都是机器的硬件出现问题需要查看系统报错日志来查看具体的错误信息。 

2、查看系统故障记录收集信息 

errdemon 进程茬系统启动时自动运行记录包括硬件、软件及其他操作信息。故障记录文件为/var/adm/ras/errlog可备份下来或拷贝到别的机器上分析。 

也可以使用errpt 命令來查看(普通用户权限也可使用) 

分析:在partition属性中有一个service authority的选项选上之后说明微码升级时是通过该分区进行。一台机器的所有lpar上只能有一个汾区有这个选项属性查看两个分析属性之后,发现两个分区都有这个属性所以引起冲突,只能有一个可以启动 

11)镜像文件系统故障 

故障:系统中有stale状态的文件系统。 

分析:文件系统的状态有:open, closed, syncd, stale前两项代表当前文件系统是否可以访问,后两项代表文件系统数据是否完铨Syncd是指数据已同步这个应该是正常时显示的,stale是指文件系统数据未同步这种状态是不正常的。 

}

在进行文件系统维护和管理过程Φ会碰到这样一些问题,例如无法安装文件系统或者无法拆卸文件系统当文件系统的超级块被破坏,而无法正常使用文件系统如何修复rootvg中的主要文件系统,下面就讨论如何解决一些常见的文件系统问题

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信