您的位置:首页 > 运维架构

服务器运维二三事

2015-02-09 16:13 141 查看
小C来着西部的边陲小镇,大专毕业后就雄心勃勃的从三线城市来到一线城市打拼。初来乍到,根据自己所学专业,找到了一家IT服务外包公司做常驻客户单位硬件系统工程师。客户单位是一家金融机构,20平米的机房里各种服务器和网络设备纷繁复杂。第一次走进去的他直看得眼花缭乱,自觉学校里学过的那点知识和本领完全不够用。还好他天之聪慧在不到几个月的时间内对通过企业提供的网站文档学习,实际操作实践初步掌握了各种运维技巧。经过一段实践的摸爬滚打,他不断积累和总结,从零基础开始,在专业技术水平不断提升。下面我们来看他所经历过的几个典型事例。

服务器搭建

记得小C刚来此企业服务时,就接到任务在增加一套IBMBladeCenter。他首先通过Web界面登陆的方式访问SharePoint系统,并产生一个变更请求。其必填项真是多得惊人,简述、类别、时间、耗时、设计范围、回退计划、测试方案等。在等到总部批复可以操作后,就想搭积木一样,他把刀片服务器插入机箱中的指定槽位,连接KVM。开机上电,检查插入刀片的运行状态灯,确认KVM在各个刀片之间切换正常。在光驱中放入SERVER GUIDE引导光盘,切换到要安装系统的刀片。他根据说明书引导和企业总部给的安装文档完成“计算机名”、“安装序列号”、“操作系统密码”等信息的录入和软件部件的选择与安装。然后一路凯歌的去安装Windows操作系统并按文档要求进行基本系统属性设置。接着是配置刀片中心管理模块和网络模块。小C连接管理模块控制口至交换机,将管理工作站与交换机连接好,通过IE访问管理模块的管理界面并进行配置。之后是更改交换机模块的管理IP地址,起用远程管理功能对刀片服务器进行管理。最后以web方式访问交换机模块进行后续配置。在收集了必要信息并反馈回总部以便编录(见下表)后,他完成变更任务,关闭之。
Server Change Request Questionnaire
Requesting manager name:Mike Chen
Date of Request:Date 3/17/2011
Desired date of availability of server:Date 3/21.2011
Requested server name (reference existing naming standards):Host Name SHDMS01
Hardware Source: New Purchase Repurposed existing hardwareNew Purchase/Repurpose NEW
Server Hardware BrandIBM
Server Hardware ModelBladeCenter HS21XM
Virtual Server?Yes
Failover Cluster Virtual Node?SHDMS02
Hardware Serial NumberServer Serial Number
Intended Application or Role (SQL, Exchange, file service, etc.)Interwoven Database
Identify Internal Disk Drives and Slots146G SAS hard disk in Slot 1~4 of HS21XM
Requested Internal Disk Storage for Application or Role (does not include operating system)Yes, for database storage
Storage (Requested disk space, recommended RAID type and volume grouping)100G, RAID 1+0 for OS, 400G RAID 5 for database
Server Location (office site and rack location)Room XXXX, XXth floor, IFC, XX Century Boulevard , Shanghai, China
Requested Operating System and Service PackWindows 2012 with SP1
Special Network Connectivity RequestsDMZ, Internet accessible, special NIC or Ethernet switch requirements, load balancing, etc. Be as detailed as possible.

故障处理

一天早上在例行机房巡检的过程中,小C发现服务器机柜里的联想深腾 B714R刀片服务器的面板上出现***的故障LED灯。小C赶忙记录下来并拍下现场状态照片。回答办公室,他立即从知识库里调出B710R的LED指示灯状态说明列表(如下)。在机箱前面的右上方,即最后一个刀片位置的上面,有两个 LED 指示灯。左边的LED提供电源状态信息,右边 LED 显示故障信息,不同颜色时表示的不同含义:

按照列表提示,这是交换模块或者是电源模块超出了正常温度所致。小C马上把这个情况以邮件形式汇报给了总部的IT人员。正巧,他们也通过集中管理软件发现了此情况。系统给出了比小C查询到的更加精确的故障说明,是电源模块B出现了故障。由于B710R的冗余电源设计,在服务器初始化搭建的时候就已配置好了3+1冗余模式,因此此故障并未造成任何系统中断,对生产环境不构成任何影响。通过和总部的进一步邮件交流,小C受命拨打联想800热线保修。一个工作日后,小C收到了电源模块备件,由于B710R支持热拔插部件更换操作,因此小C顺利完成替换,排除了潜在的安全隐患。

配置管理

由于IT服务的配置信息是对于企业的IT日常运作与资产管理起着参考和支撑作用。小C服务的该企业IT总部也建立并维护着一个信息较为全面的配置项数据库(CMDB),方面总部及各分支机构IT随时、按需管理IT资产并查询。IT服务信息。值得一提的是,小C第一登陆到该数据库熟悉环境的时候,就被其细致入微的信息量所震撼了。该库编制了一张无形的网,以带有特征属性的配置项(CI)为信息点,并体现着相互依存、调用关系。通过专属客户端程序,以思维导图的形式呈现出来,当鼠标放置到节点上时,就能浮现出如下信息表:
条目内容信息备注
唯一编号650099743系统自动分配
登记时间200906281543系统自动分配
类型ID01250203101内部服务,25物理上在上海,02硬件件库,031子库序号
设备名称BladeCenter JS22
设备串号SNXX00YY11ZZ
管理人员Mike Chen(+86 2271 0685)Cellphone: 137 5461 8923
安装地点上海XX区YY机柜上的ZZ号位
供应商IBM服务热线:800-XXX-XXXX
配置项目历史2000,2003,2008超级链接可查询过往信息
连接关系通过三层交换机(如SHSWL3012401025)的第XX端口连入内网拓扑图(可点击的链接)
服务用途安装了虚拟机,用于提供中间件集群
在小C典型的日常维护工作中,诸如联想深腾B714R刀片交换机的端口出现问题,刀片上各个应用系统与外界失联;或者是在刀片服务器的SCSI存储扩展选件中安装硬盘不被系统识别和引导等类似事件,他经常碰到。虽然这使得他整天都很忙碌,但是对于小C这样乐观的技术控来说还是蛮充实的。他深知像他这样来自普通专科学院的职场新人,能找到这样弥足珍贵的工作机会来之不易。也许在常人眼里,这样的工作表面上看去实在是枯燥无味。而小C却能面带微笑的灵活应对着,“品尝”到其中的“美味”。他视之为一条快捷提升自己并保持知识更新的方式。正所谓,心有多大舞台就有多大。在这个快节奏的城市里,他算是走在了同龄人的前列。继续奔跑吧,小C!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  刀片 服务器运维