::: SYSTEM :::/└ ::: HPUX :::

Mirror 복구 ...

호딩이 2008. 3. 7. 09:20
1. Disk failure(OS disk fail)

Mirror가 되어 있는 경우
 #ioscan –fnCdisk  디스크 상태 확인
   - NO_HW : disk 인식 불능
   - SCANNING : disk재인식 단계(2분정도 후 정상으로 보임)
   - CLAIMED : 정상
 # Disk LED확인
 # vgdisplay –v vg00 : PV상태 확인
 # mirror가 깨졌을 경우 vgsync vg00으로 복구

 ** 복구가 되지 않는 경우
  Defect된 disk 교체후
  # pvcreate –f –B /dev/rdsk/c#t#d#
  # vgcfgrestore –n /dev/vg00 /dev/rdsk/c#t#d#
  # vgsync vg00  mirror 재복구
  # vgdisplay –v vg00  mirror 복구 확인

Mirror가 되어 있지 않은 경우
  - ignite tape을 넣은 후
   1> BCH모드에서 tape device로 부팅
   2> ignite tape으로 부팅후 OS복구됨
 
2. OS fail(Kernel 장애)  
Kernel backup으로 booting
   1> 예비 커널로 부팅하는 경우
   # rebooting 후 10초안에 interrupt하라는 메시지 나오면 아무key나 눌러서 BCH모드로 들어감
   # bo pri isl  ISL mode로 들어감
   ISL> hpux  -lq  hp-ux booting시도
커널 로딩 실패시
   ISL> hpux /stand/vmunix.prev  예비커널로 부팅 시도..실패시 ignite tape으로 복구.

3. Disk fail(Array)
Disk 교체
#ioscan –fnCdisk  disk status 확인
# diskinfo /dev/rdsk/c#t#d#
#vgdisplay –v vg##  해당 PV확인
# disk fault LED(주황색) 확인
 
**현재 RAID기능이 제공되는 nike array의 경우
 defect된 disk를 on-line중에 replace를 하면 자동으로 복구됨.
# controller fail시 해당 controller의 LED를 확인하여 fault 확인되면 replacement
 
4. LAN card fail
- LAN card교체
- network configuration확인
- 인접 서버간 ping test 실패시
  # netstat –in으로 해당 interface확인
  # lanscan 으로 해당 card ppa ,path확인
  # 육안으로 linkup 상태 확인
  # lanadmin –X ppa_num으로 속도(halt or full duplex여부 확인)
  # lan card reset (lanadmin  ppa 번호 reset )
  # LAN card교체 / ping test 실시
 
5. System dump(OS장애)
Dump분석후 조치
# system reboot after panic
# cd /var/adm/crash  dump directory로 이동
# dump가 있는 directory로 이동후
   # q4    -> dump분석 tool 실행
# q4> trace event 0   panic상황 분석
     실행 output이 hpmc인경우  rc에 ts99 file분석 의회
     panic 또는 TOC인 경우  dump를 tape에 받아서 RC에 분석 의뢰
*** dump 분석 후 필요한 patch등을 적용함.