北肙

当你不能够再拥有,唯一可以做的,就是令自己不要忘记。

Author: norvyn

客户处有一HP P2000 G3的存储,由于机房停电而异常关机,再次上电开机后发现同时有4块硬盘亮起了故障灯。接到case时,已经过了半月有余,不但该存储无法访问数据,连接它的主机也由于不明原因无法使用数据库。经过排查,发现几个问题。存储共2个盘柜,共14块盘,其中8块盘作了raid5,其它6块盘作了raid6,全局无热备盘。出现故障时,两个raid组中各坏了两块盘,raid5已经是“offline”状态,raid6则是“degrade”状态。对于主机来说,/sybase安装了数据库,目前使用率已100%,连接数据库时报“状态=JZ006”错误,排除存储本身的数据问题,sybase不能连接也和没有空间写日志有关系。 一、HP P2000 G3更换硬盘 1、管理口地址:10.0.0.2(A控)、10.0.0.3(B控),掩码255.255.255.0,用户名manage,密码!manage 2、   raid6本身有6块盘,坏了两块,热插拔更换硬盘后,系统并没有自动将新盘添加到卷簇而是标记为“AVAI”状态,需要手动将该盘添加到相应卷簇作为热备盘,而后系统会自动同步数据。具体操作如下: 在左侧一栏选择相应的虚拟磁盘 à configuration à manage dedicated spare à 勾选需要的硬盘(状态是AVAI) à modify spares à 搞定。 3、   raid5中两块有故障的硬盘,在管理界面中状态显示是“LFTOVR”,且该卷簇已“officeline”,可尝试使用“trust”命令。官方文档中关于此命令的使用禁忌有详细说明。文中提到该命令“只能作为进行灾难恢复的最后一步使用“、“此命令可能导致数据永久丢失,虚拟磁盘运行不稳定“、”如果具有一个磁盘的虚拟磁盘处于保留或故障状态,千万不要使用trust命令“,还提到“trust命令尝试同步保留磁盘,以使得所有保留磁盘再次成为虚拟磁盘的活动成员“。因为文中案例的Vdisk已是脱机状态且不止一块物理盘,加上卷簇中数据对于客户来说不是特别重要,于是尝试用trust命令。 # trust enable     //有些系统中该命是被禁用的 # show vdisk       //查看系统中全部虚拟磁盘(raid组)的状态 # trust vdisk*      //trust有保留(“LFTOVR”)磁盘的虚拟磁盘(卷簇) # show vdisk       //再次查看vdisk状态 如图所示,vd02执行trust命令后已经开始同步数据。系统中查看之前两块硬盘的状态,已经恢复正常。 至于成员盘为何会成为保留(LFTOVR)状态,官方有如下解释: a)在控制器轮询驱动器之前,驱动器加速转动未完成。当控制器查询驱动器并发现驱动器未处于就绪状态时,它会将驱动器置于 “保留”状态。 b)开机顺序不正确。 c)固件升级(由于定时问题)。 d)故障转移所耗时间比期望的时间长。 e)从其他 MSA 系统中交换驱动器,或从阵列中删除和重新插入。 官方还警示,通过trust命令激活的卷簇对于其它故障是零容忍,不能再放回生产环境中去,所以需要把trust后的虚拟磁盘上面的数据备份,删掉该虚拟磁盘后进行重建。 4、   添加热备盘 P2000 G3 Experiment à provisioning à manage global spares à 选中需要的硬盘 à modify spares à 搞定。 二、扩展HP-UX文件系统 1、   查看是否可以在线扩展 # swlist | grep –I vxfs […]

日子就像这文章,不知道该怎么写。但若是有个开头,一旦下笔,记些生活中的流水帐,倒也可以洋洋洒洒,写它个千八百字。但是生活,不管你决定怎么过,就算是开个头,又有多少是你能够掌握的。 有一个问题,想了我好几年,看似时时在想,又仿佛抛在脑后,想它的时候,那是我未见过的大海,我想着它的辽阔,寻着它的边际,却一次又一次淹没在这蓝色之中。最初我看到沙滩,我以为这就是海边,后来我看到礁石,我觉得我已经走出了这桎梏,然后我又看见灯塔,原来这才是我想要找的光明,但是这天地之间,我浸着这冷,尝着这咸,我颠簸在这风口浪尖,当我冻得神志不清,这光明就像一根稻草,但却救不了我的命。 后来,每当春暖花开,在沙滩上面朝大海,那时迎着太阳,把光明深深刺在眼底,都会想到那挥之不去的灯塔。 谁说希望不是好奇心呢? 如果有朝一日,我能在这灯塔之上俯瞰众生,我一窥这世界的全貌,是否还能回到这醋甜苦辣的家长里短之中。 时时拿“一花一世界”来标榜自己算个文化人,但总是在你从一个世界跳到另一个世界的过程中,在你从第一个世界死,另一个世界生的过程中,才可以体会到钟书先生所谓的围城,而这每一个城,就是一个混沌,而这每一个城,都是我们努力想走出去的枷锁,到头来不过是换了一身衣装,却还是在去往刑场的路上。 这世界无穷无尽,偏偏生了处处受限的我们。对于一个无限大,不管你如何运算,都只是一个符号而已。 在这个你逃不掉,躲不开的程序中,你我虽自命清高,但终究只是一个函数,一个算法,抑或仅仅是一个被不慎定义却又忘记使用的变量。 生亦何苦,死亦何哀。生死本就是平常事,如果这之间必定要经历一个过程,又何必因噎废食,本末倒置,毕竟谢了花,才会有果子吃。 这个问题,我想它的时候,生命很近,生活很远。生命很近,近得几乎看得到灵魂;生活很远,一切存在显得都毫无意义。这个问题,我想忘记它的时候,理想很近,生存很远。理想很近,近得触手可及;生存很远,所有建立在金钱之上的交易,都易如反掌。而这个问题,我已经忘记它的时候,现实很近,自己很远。现实很近,近得每天不过柴米油盐;自己很远,尸骨渴望着鲜血,思想在坟墓中长眠。 或当有一天,腐烂的尸骨上爬满了蛆虫,愿这思想和墓志铭,都化成一阵风,散了这无休无止的诅咒吧。

官方手册中对于该机器更换硬盘的描述非常简单。翻译过来大致是,富士通T2000硬盘是可以热插拔的,但是要取决于硬盘如何配置使用。安全热插拔硬盘前须先将硬盘下线(offline),具体指断开任何应用与该驱动器之间的数据通信并移除该驱动器中逻辑链接,umount该驱动器上文件系统或者做一些raid的配置。 以下情况中,硬盘驱动器是不可以热插拔的: 该硬盘上安装了操作系统,但是该系统并没有做根盘镜像; 服务器系统中的在线操作和需要更换的硬盘存在逻辑上的关联。 更换任何硬盘前,都应该确认该盘位置,对于富士通T2000服务器,四块硬盘位置如下图所示。

开机需知: 1、接通电源后,设备需要大约3分钟进入状态(比如”READY”灯变亮)。如果在开机诊断阶段发现错误,这一过程则需要长达10分钟。 2、在启动相关主机前,应检查设备、光通道开关和光通道集线器都已准备好。如果相关主机启动的时候这些设备没有准备好,主机将识别不到该设备。 3、设备第一次启动,会运行一组出厂预置的程序。 开机步骤: 1、按一下控制器电源开关,等待电源指示灯变亮。如果有扩展柜,会自动上电,不需要按电源开关。 2、几分钟后,检查控制器”READY”是否已点亮。 3、检查所有控制器和护展柜电源指示灯和”READY”灯已点亮。 关机需知: 1、关闭设备后,只有当缓存中的数据被写入硬盘才可以断电。因此,设备电池需要1-6分钟完全关闭。 2、不要在相关的主机还有操作时关闭与之相连的网络设备和存储,否则会造成数据丢失。 关机步骤: 1、按住控制器电源开关至少4秒,等待控制器”READY”(非”POWER”灯)灯变灭。 注意:仅一次按住控制器电源开关。如果在”READY”灯变灭和电源指示灯变灭之间再一次按下电源开关,设备可能会被重新开机。 2、等待”POWER”指示灯变灭,该设备完成下电。如果有扩展柜,会自动下电,不需要按电源开关。