北肙

当你不能够再拥有,唯一可以做的,就是令自己不要忘记。

HP P2000更换硬盘及HP-UX扩展LV

客户处有一HP P2000 G3的存储,由于机房停电而异常关机,再次上电开机后发现同时有4块硬盘亮起了故障灯。接到case时,已经过了半月有余,不但该存储无法访问数据,连接它的主机也由于不明原因无法使用数据库。经过排查,发现几个问题。存储共2个盘柜,共14块盘,其中8块盘作了raid5,其它6块盘作了raid6,全局无热备盘。出现故障时,两个raid组中各坏了两块盘,raid5已经是“offline”状态,raid6则是“degrade”状态。对于主机来说,/sybase安装了数据库,目前使用率已100%,连接数据库时报“状态=JZ006”错误,排除存储本身的数据问题,sybase不能连接也和没有空间写日志有关系。 一、HP P2000 G3更换硬盘 1、管理口地址:10.0.0.2(A控)、10.0.0.3(B控),掩码255.255.255.0,用户名manage,密码!manage 2、   raid6本身有6块盘,坏了两块,热插拔更换硬盘后,系统并没有自动将新盘添加到卷簇而是标记为“AVAI”状态,需要手动将该盘添加到相应卷簇作为热备盘,而后系统会自动同步数据。具体操作如下: 在左侧一栏选择相应的虚拟磁盘 à configuration à manage dedicated spare à 勾选需要的硬盘(状态是AVAI) à modify spares à 搞定。 3、   raid5中两块有故障的硬盘,在管理界面中状态显示是“LFTOVR”,且该卷簇已“officeline”,可尝试使用“trust”命令。官方文档中关于此命令的使用禁忌有详细说明。文中提到该命令“只能作为进行灾难恢复的最后一步使用“、“此命令可能导致数据永久丢失,虚拟磁盘运行不稳定“、”如果具有一个磁盘的虚拟磁盘处于保留或故障状态,千万不要使用trust命令“,还提到“trust命令尝试同步保留磁盘,以使得所有保留磁盘再次成为虚拟磁盘的活动成员“。因为文中案例的Vdisk已是脱机状态且不止一块物理盘,加上卷簇中数据对于客户来说不是特别重要,于是尝试用trust命令。 # trust enable     //有些系统中该命是被禁用的 # show vdisk       //查看系统中全部虚拟磁盘(raid组)的状态 # trust vdisk*      //trust有保留(“LFTOVR”)磁盘的虚拟磁盘(卷簇) # show vdisk       //再次查看vdisk状态 如图所示,vd02执行trust命令后已经开始同步数据。系统中查看之前两块硬盘的状态,已经恢复正常。 至于成员盘为何会成为保留(LFTOVR)状态,官方有如下解释: a)在控制器轮询驱动器之前,驱动器加速转动未完成。当控制器查询驱动器并发现驱动器未处于就绪状态时,它会将驱动器置于 “保留”状态。 b)开机顺序不正确。 c)固件升级(由于定时问题)。 d)故障转移所耗时间比期望的时间长。 e)从其他 MSA 系统中交换驱动器,或从阵列中删除和重新插入。 官方还警示,通过trust命令激活的卷簇对于其它故障是零容忍,不能再放回生产环境中去,所以需要把trust后的虚拟磁盘上面的数据备份,删掉该虚拟磁盘后进行重建。 4、   添加热备盘 P2000 G3 Experiment à provisioning à manage global spares à 选中需要的硬盘 à modify spares à 搞定。 二、扩展HP-UX文件系统 1、   查看是否可以在线扩展 # swlist | grep –I vxfs […]

客户处有一HP P2000 G3的存储,由于机房停电而异常关机,再次上电开机后发现同时有4块硬盘亮起了故障灯。接到case时,已经过了半月有余,不但该存储无法访问数据,连接它的主机也由于不明原因无法使用数据库。经过排查,发现几个问题。存储共2个盘柜,共14块盘,其中8块盘作了raid5,其它6块盘作了raid6,全局无热备盘。出现故障时,两个raid组中各坏了两块盘,raid5已经是“offline”状态,raid6则是“degrade”状态。对于主机来说,/sybase安装了数据库,目前使用率已100%,连接数据库时报“状态=JZ006”错误,排除存储本身的数据问题,sybase不能连接也和没有空间写日志有关系。

一、HP P2000 G3更换硬盘
1、管理口地址:10.0.0.2(A控)、10.0.0.3(B控),掩码255.255.255.0,用户名manage,密码!manage
2、   raid6本身有6块盘,坏了两块,热插拔更换硬盘后,系统并没有自动将新盘添加到卷簇而是标记为“AVAI”状态,需要手动将该盘添加到相应卷簇作为热备盘,而后系统会自动同步数据。具体操作如下:
在左侧一栏选择相应的虚拟磁盘 à configuration à manage dedicated spare à 勾选需要的硬盘(状态是AVAI) à modify spares à 搞定。
3、   raid5中两块有故障的硬盘,在管理界面中状态显示是“LFTOVR”,且该卷簇已“officeline”,可尝试使用“trust”命令。官方文档中关于此命令的使用禁忌有详细说明。文中提到该命令“只能作为进行灾难恢复的最后一步使用“、“此命令可能导致数据永久丢失,虚拟磁盘运行不稳定“、”如果具有一个磁盘的虚拟磁盘处于保留或故障状态,千万不要使用trust命令“,还提到“trust命令尝试同步保留磁盘,以使得所有保留磁盘再次成为虚拟磁盘的活动成员“。因为文中案例的Vdisk已是脱机状态且不止一块物理盘,加上卷簇中数据对于客户来说不是特别重要,于是尝试用trust命令。
# trust enable     //有些系统中该命是被禁用的
# show vdisk       //查看系统中全部虚拟磁盘(raid组)的状态
# trust vdisk*      //trust有保留(“LFTOVR”)磁盘的虚拟磁盘(卷簇)
# show vdisk       //再次查看vdisk状态
201512251451030007395362
如图所示,vd02执行trust命令后已经开始同步数据。系统中查看之前两块硬盘的状态,已经恢复正常。
至于成员盘为何会成为保留(LFTOVR)状态,官方有如下解释:

  1. a)在控制器轮询驱动器之前,驱动器加速转动未完成。当控制器查询驱动器并发现驱动器未处于就绪状态时,它会将驱动器置于 “保留”状态。
  2. b)开机顺序不正确。
  3. c)固件升级(由于定时问题)。
  4. d)故障转移所耗时间比期望的时间长。
  5. e)从其他 MSA 系统中交换驱动器,或从阵列中删除和重新插入。

官方还警示,通过trust命令激活的卷簇对于其它故障是零容忍,不能再放回生产环境中去,所以需要把trust后的虚拟磁盘上面的数据备份,删掉该虚拟磁盘后进行重建。
4、   添加热备盘
P2000 G3 Experiment à provisioning à manage global spares à 选中需要的硬盘 à modify spares à 搞定。

二、扩展HP-UX文件系统
1、   查看是否可以在线扩展
# swlist | grep –I vxfs
如果只出现Base-VXFS则扩展之前需要umount文件系统,如果有OnlineJfs则不需要umount可直接在线扩展。
2、   卸载文件系统
由于/sybase安装了数据库,而该库无法连接,所以无法正常关闭数据库,只能通过查看哪个进程在使用/sybase目录,再kill掉。
# fuse –cu /sybase
# kill -9 12345     //将12345换成具体的pid
# umount /sybase
3、   扩展卷簇
# mount    //查看/sybase挂载到哪个vg哪个lv,本文中为/dev/vg00/sybaselv,且大小为20GB,“bdf”命令也可以
# vgdisplay –v vg00      //查看该vg剩余多少空间没有分配,文中案例两块本地盘还剩800多个PE,每个PE是32M,所以剩余空间大概有25GB
# lvextend –L 30000 /dev/vg00/sybaselv    //将该逻辑卷扩展至30GB
# lvextend –L 100000 /dev/vg00/sybaselv  //增加10GB
# lvextend –l 1000 /dev/vg00/sybaselv      //扩展至1000个PE
# extendfs /dev/vg00/sybaselv
顺便提一句,如果安装了onlineJFS产品
# fsadm –F vxfs –b 30000 /sybase    //未测试

三、sybase数据库开、关命令
1、   查看servername
# cat $SYBASE/interfaces       //也就是本文中/sybase/interface201512251451030051345042
2、   启动数据库
# startserver –f RUN_MICS     //格式为RUN_自己的servername
如果提示找不到RUN_MICS文件,可以输入绝对路径或者切到“$SYBASE/SYBASE_ASE/install”目录下执行
3、   关闭数据库
# isql –Usa –P123456 –Sservername //123456改为用户sa的密码,servername改为上图中所示内容
Ø  shutdown MICS
Ø  go        //输完命令后执行go,才会生效
Ø  reset     //如果命令输错,可以reset

Leave a Reply

Your email address will not be published. Required fields are marked *