1. Disk failure(OS disk fail)
Mirror가 되어 있는 경우
#ioscan –fnCdisk 디스크 상태 확인
- NO_HW : disk 인식 불능
- SCANNING : disk재인식 단계(2분정도 후 정상으로 보임)
- CLAIMED : 정상
# Disk LED확인
# vgdisplay –v vg00 : PV상태 확인
# mirror가 깨졌을 경우 vgsync vg00으로 복구
** 복구가 되지 않는 경우
Defect된 disk 교체후
# pvcreate –f –B /dev/rdsk/c#t#d#
# vgcfgrestore –n /dev/vg00 /dev/rdsk/c#t#d#
# vgsync vg00 mirror 재복구
# vgdisplay –v vg00 mirror 복구 확인
Mirror가 되어 있지 않은 경우
- ignite tape을 넣은 후
1> BCH모드에서 tape device로 부팅
2> ignite tape으로 부팅후 OS복구됨
2. OS fail(Kernel 장애)
Kernel backup으로 booting
1> 예비 커널로 부팅하는 경우
# rebooting 후 10초안에 interrupt하라는 메시지 나오면 아무key나 눌러서 BCH모드로 들어감
# bo pri isl ISL mode로 들어감
ISL> hpux -lq hp-ux booting시도
커널 로딩 실패시
ISL> hpux /stand/vmunix.prev 예비커널로 부팅 시도..실패시 ignite tape으로 복구.
Kernel backup으로 booting
1> 예비 커널로 부팅하는 경우
# rebooting 후 10초안에 interrupt하라는 메시지 나오면 아무key나 눌러서 BCH모드로 들어감
# bo pri isl ISL mode로 들어감
ISL> hpux -lq hp-ux booting시도
커널 로딩 실패시
ISL> hpux /stand/vmunix.prev 예비커널로 부팅 시도..실패시 ignite tape으로 복구.
3. Disk fail(Array)
Disk 교체
#ioscan –fnCdisk disk status 확인
# diskinfo /dev/rdsk/c#t#d#
#vgdisplay –v vg## 해당 PV확인
# disk fault LED(주황색) 확인
**현재 RAID기능이 제공되는 nike array의 경우
defect된 disk를 on-line중에 replace를 하면 자동으로 복구됨.
defect된 disk를 on-line중에 replace를 하면 자동으로 복구됨.
# controller fail시 해당 controller의 LED를 확인하여 fault 확인되면 replacement
4. LAN card fail
- LAN card교체
- network configuration확인
- 인접 서버간 ping test 실패시
# netstat –in으로 해당 interface확인
# lanscan 으로 해당 card ppa ,path확인
# 육안으로 linkup 상태 확인
# lanadmin –X ppa_num으로 속도(halt or full duplex여부 확인)
# lan card reset (lanadmin ppa 번호 reset )
# LAN card교체 / ping test 실시
- LAN card교체
- network configuration확인
- 인접 서버간 ping test 실패시
# netstat –in으로 해당 interface확인
# lanscan 으로 해당 card ppa ,path확인
# 육안으로 linkup 상태 확인
# lanadmin –X ppa_num으로 속도(halt or full duplex여부 확인)
# lan card reset (lanadmin ppa 번호 reset )
# LAN card교체 / ping test 실시
5. System dump(OS장애)
Dump분석후 조치
# system reboot after panic
# cd /var/adm/crash dump directory로 이동
# dump가 있는 directory로 이동후
# q4 -> dump분석 tool 실행
# q4> trace event 0 panic상황 분석
실행 output이 hpmc인경우 rc에 ts99 file분석 의회
panic 또는 TOC인 경우 dump를 tape에 받아서 RC에 분석 의뢰
Dump분석후 조치
# system reboot after panic
# cd /var/adm/crash dump directory로 이동
# dump가 있는 directory로 이동후
# q4 -> dump분석 tool 실행
# q4> trace event 0 panic상황 분석
실행 output이 hpmc인경우 rc에 ts99 file분석 의회
panic 또는 TOC인 경우 dump를 tape에 받아서 RC에 분석 의뢰
*** dump 분석 후 필요한 patch등을 적용함.