服务器12种基本故障及排查方法

乐清SEO_服务器技术_ 乐清SEO2021-02-04 转载自:

第一章 加电类故障

一、定义举例

从上电(或复位)到自检完成这一段过程中电脑所发生的故障。

二、可能的故障现象

1、 主机不能加电(如:电源风扇不转或转一下即停等)、有时不能加电、开机掉闸、机箱金属部分带电等;

2、 开机无显,开机报警;

3、 自检报错或死机、自检过程中所显示的配置与实际不符等;

4、 反复重启;

5、 不能进入BIOS、刷新BIOS后死机或报错;CMOS掉电、时钟不准;

6、 机器噪音大、自动(定时)开机、电源设备问题等其它故障。

三、可能涉及的部件

市电环境;电源、主板、CPU、内存、显示卡、其它可能的板卡;BIOS中的设置(可通过放电来回复到出厂状态);开关及开关线、复位按钮及复位线本身的故障。

四、判断要点/顺序

以下的文字叙述部分是对维修判断流程的补充和说明,要结合流程图来阅读。另外,本章只分析加电类的故障,如果在判断中涉及其它类故障,可转入相应故障的判断过程。以下各类同。

服务器12种基本故障及排查方法

1、 维修前的准备

1) POST卡;

2) 万用表;

3) 试电笔;

4) CPU负载。

2、 环境检查

1) 检查电脑设备:

A. 周边及电脑设备内外是否有变形、变色、异味等现象;

B. 环境的温、湿度情况;

C. 加电后,注意部件、元器件及其它设备是否变形、变色、异味、温度异常等现象发生。

2) 检查市电情况:

A. 检查市电电压是否在220V±10%范围内,是否稳定(即是否有经常停电、瞬间停电等现象);

B. 市电的接线定义是否正确(即,左零右火、不允许用零线作地线用(现象是零地短接)、零线不应有悬空或虚接现象);

C. 供电线路上是否接有漏电保护器(且必须接地火线上),是否有地线等;

D. 主机电源线一端是否牢伤心地插在市电插座中,不应有过松或插不到位的现象,另一端是否可伤心在接在主机电源上,不应有过松或插不到位的情况。

第二章 启动与关闭类故障

一、定义举例

与启动、关闭过程有关的故障。启动是指从自检完毕到进入xx作系统应用界面这一过程中发生的问题;关闭系统是指从点击关闭按扭后到电源断开之间的所有过程。

二、可能的故障现象

1、 启动过程中死机、报错、黑屏、反复重启等;

2、 启动过程中报某个文件错误;

3、 启动过程中,总是执行一些不应该的xx作(如总是磁盘扫描、启动一个不正常的应用程序等);

4、 只能以安全模式或命令行模式启动;

5、 登录时失败、报错或死机;

6、 关闭xx作系统时死机或报错。

三、可能涉及的部件

BIOS设置、启动文件、设备驱动程序、xx作系统/应用程序配置文件;电源、磁盘及磁盘驱动器、主板、信号线、CPU、内存、可能的其它板卡。

四、判断要点/顺序

1、 维修前的准备

1) 磁盘数据线;

2) 万用表;

3) 查毒软件。

2、 环境检查

1) 机器周边及外观检查:

A. 市电连接是否牢伤心,不应有过松或插不到位的现象;

B. 主机硬盘指示灯是否正确闪亮,不应有不亮或常亮的现象;

C. 观察系统是否有异味,元器件的温度是否偏高;

D. 观察CPU风扇的转速是否不够,或是否过慢或不稳定;

E. 倾听驱动器工作时是否有异响。

2) 驱动器连接检查:

A. 驱动器的电源连接是否正确、牢伤心。驱动器上的电源连接插座是否有虚接的现象;

B. 驱动器上的跳线设置是否与驱动器连接在电缆上的位置相符;

C. 驱动器数据电缆是否接错或漏接,规格是否与驱动器的技术规格相符(如:支持DMA66的驱动器,必须使用80芯数据电缆);

D. 驱动器数据电缆是否有故障(如露出芯线、有死弯或硬痕等),除可通过观察来判断外,也可通过更换一根数据电缆来检查;

E. 驱动器是否通过其它板卡连接到系统上,或通过其它板卡(如硬盘保护卡,双网隔离卡等)来控制。

3) 检查其它部件的安装:

A. 通过重新插拔部件(包括CPU、内存),检查故障是否消失(重新插拔前,应该先做除尘和清洁金手指工作,包括插槽)。如果总是通过重新插拔来解决,应检查部件安装时,是否过松、后档板尺寸是否不合适、插座太紧,以致插不到位或被挤出;

B. 检查CPU风扇与CPU是否接触良好。最好重新安装一次。

4) 显示的内容的观察:要注意屏幕报错的内容、死机的位置,以确定故障可能发生的部位。

3、 故障判断要点

1) 充分地与用户沟通,了解出现不能启动的过程及用户的xx作;

2) BIOS设置检查:

A. 是否为刚更换完不同型号的硬件。如果主板BIOS支持BOOTEasy功能或BIOS防写开关打开,则建议将其关闭,待完成一次完整启动后,再开启;

B. 是否添加了新硬件。这时应先去除添加的硬件,看故障是否消失,若是,检查添加的硬件是否有故障,或系统中的设置是否正确(通过对比新硬件的使用手册检查);

C. 检查BIOS中的设置,如:启动顺序、启动磁盘的设备参数等。建议通过清CMOS来恢复;

D. 检查是否由于BIOS问题(包括设置及功能)引起xx作系统不能正常启动或关闭,可偿试将Windows目录下的BIOS.vxd(或VPBIOSD.vxd)改名为BIOS.old,然后重启,或关闭,若故障消失,则通过修改BIOS设备或更新BIOS来解决,否则与BIOS无关。注意测试完成以后,一定要将其改回原来的名字(注:除Windows 98外,其它xx作系统无此文件);

E. 在某些特殊情况下,应考虑升级BIOS来检查。如:对于在第一次开机启动后,某些应用或设备不能工作的情况,除检查设备本身的问题外,就可考虑更新BIOS来解决。

以下检查应在软件最小系统下进行。

3) 磁盘逻辑检查:

A. 根据启动过程中的错误提示,相应地检查磁盘上的分区是否正确、分区是否激活、是否格式化;

B. 直接检查硬盘是否已分区、格式化;

C. 加入一个其它无故障的驱动器(如软驱或光驱)来检查能否从其它驱动器中启动(若使用软驱,最好使用希捷的检测软盘启动)。若能,进行第3)、4)步的检查,否则进行第5)步的检查;接着、分区是否激活、有无坏道等;

D. 硬盘上的启动分区是否已激活,其上是否有启动时所用的启动文件或命令;

E. 检查硬盘驱动器上的启动分区是否可访问,若不能,用相应厂商的磁盘检测程序检查硬盘是否有故障。有故障,更换硬盘;在无故障的情况下,通过初始化硬盘来检测,若故障依然存在,更换硬盘;

F. 在用其它驱动器也不能启动时,先将硬盘驱动器去除,看是否可启动,若仍不能,应对软件最小系统中的部件进行逐一检查,包括硬盘驱动器和磁盘传输的公共部件——磁盘接口、电源、内存等。若可启动了,最好对硬盘进行一次初始化xx作,若故障不消失,则再更换硬盘; 1