自己总结了一下巡检的工作,还有哪里错漏请留言告知,谢谢各位路过的大师了~~
1、检查crs状态:
/oracle/product/10.2/crs/bin/crs_stat -t
2、检查数据库状态(db1、db2)
连接到db1(10.10.0.10)
SQL> select instance_number, instance_name ,host_name, version, status from v$instance;
连接到db2(10.10.0.20)
SQL> select instance_number, instance_name ,host_name, version, status from v$instance;
3、检查监听程序状态
lsnrctl status
4、检查oracle告警日志
RAC1:
cd $ORACLE_BASE/admin/orcl/bdump && tail -666 alert_orcl1.log
RAC2:
cd $ORACLE_BASE/admin/orcl/bdump && tail -666 alert_orcl2.log
数据库运行过程中是否有异常的数据库启动停止
查看日志中是否有
ALTER DATABASE OPEN
This instance was first to open
内容显示,确认显示的时间确实是数据库手工启动的时间
查看日志中是否有
Completed: ALTER DATABASE CLOSE NORMAL
内容显示,确认显示的时间是否是数据库手工关闭的时间
5、检查监听日志(在ORACLE_HOME/NETWORK/LOG/)检查是否有报错
cd $ORACLE_HOME/network/log && tail -66 listener.log
6、Oracle集群(CRS)的alert日志和CRS logs:
RAC1
cd /oracle/product/10.2/crs/log/db1 && tail -100 alertdb1.log
cd /oracle/product/10.2/crs/log/db1/crsd/ && tail -166 crsd.log --crsd.log: th_select_handler message 是可以忽略的信息
cd /oracle/product/10.2/crs/log/db1/cssd/ && tail -166 ocssd.log
cd /oracle/product/10.2/crs/log/db1/racg/ && tail -66 evtf.log
#cd /oracle/product/10.2/crs/log/db1/client/*.log
cd /oracle/product/10.2/crs/log/db1/evmd/ && tail -66 evmd.log
RAC2
cd /oracle/product/10.2/crs/log/db2 && tail -100 alertdb2.log
7、ASM logs:
RAC1:
cd /oracle/admin/+ASM/bdump/ && tail -100 alert_+ASM1.log
RAC2:
cd /oracle/admin/+ASM/bdump/ && tail -100 alert_+ASM2.log
8、实时监视:
1.oracle告警日志:
RAC1(10.10.0.10):
cd $ORACLE_BASE/admin/orcl/bdump && tail -20f alert_orcl1.log
RAC2(10.10.0.20):
cd $ORACLE_BASE/admin/orcl/bdump && tail -20f alert_orcl2.log
2.Oracle集群(CRS)的alert日志
cd /oracle/product/10.2/crs/log/db1 && tail -20f alertdb1.log