|
知识积累: linux安装及配置 unix安装及配置
相关知识链接: 用Win Server2003搭建安全文件服务器http://searchwindowssecurity.techtarget.com.cn/tips/121/2554121.shtml IIS6.0安装:
四、服务器管理经验谈
在服务器的管理中,服务器软件故障占有的比例较高,因此我们在解决软件故障的同时,也要注意总结一些服务器维护过程中的小技巧,以尽量减少故障的发生。
维护案例一:一台用作数据服务器的HP服务器,始终无法安装SQL SERVER 2000。
解决思路及方案:首先考虑的是系统原因,但重装了Win2000、Win2003都不行。由于可以正常安装操作系统,说明光驱的读盘能力没有问题。其次,考虑原来的安装盘是一张刻录的SQL SERVER光盘问题,更换为正版SQL SERVER光盘后,继续安装,在安装的过程中,没有出错,但一运行SQL就会自动退出,没有任何提示。能正常安装但无法运行。因此,最后自然考虑到是进程问题,打开“管理工具”中的“事件查看器”的系统日志发现了一条信息:windata.exe导致一个无效的数据溢出。Windata是朋友自己编写的一个程序,而且是随操作系统启动而启动的程序。我立即结束掉这个进程后,再运行SQL一切正常。
经验小结:当遇到软件无法运行或安装时,网管最好先查看有关的日志,看看系统中是否有可疑的进程。目前的服务器无论是高端还是低端,对于SQL等标准程序的支持是相当可靠的,所以排除的重点就是结束可疑进程。
维护案例二:一台HP LH6000R服务器,配置为双PIII XEON 700带2M高速缓存的CPU、512M内存。开机后,系统日志报电压调节模块异常(VRM)的错误,报错的信息是:“Voltage Regulator Module (VRM) over/under-voltage 2.88V/0V”。
解决思路及方案:根据提示首先考虑可能是服务器的电压调节模块或其它硬件出现故障,通知厂商维修工程师更换了硬件,但更换新配件后,故障依旧。厂商维修工程师带来了最新的CPU管理板的固件,升级CPU管理板块的FIRMWARE后,服务器恢复立即正常。
经验小结:导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。
维护案例三:一台HP Proliant DL385服务器,稳定使用两年后,最近该服务器经常出现莫名其妙地重新启动或者死机现象,严重的时候还出现CMOS信息发生丢失的故障。
解决思路及方案:首先考虑是软件故障,重装系统后,服务器仍然经常莫名其妙重启。在排除软件故障后,考虑可能是服务器中的某一个硬件引起的重启。由于CMOS信息的丢失,先对服务器分别进行了CMOS放电操作以及接地电阻测试操作,但故障依就。电话联系HP技术人员,HP技术人员根据我口述的故障现象,提出两种方案,一是清除服务器内的灰尘;二是更换内存条。联系HP售后人员打开服务器机箱外壳,将相关板卡从服务器上拆卸下来,用柔软的细毛刷将服务器内部全部清洁干净,包括板卡金手指上的灰尘,再将所有拆卸下来的板卡通通恢复到原来位置,最后接通服务器电源,观察运行三天后,故障解决了。
经验小结:服务器的工作环境是不可忽视的重要环节,一定要保证在一个干燥、防雷、干净的环境中,否则服务器芯片表面布满灰尘后,在夏季多雨、潮湿环境的作用下,会对服务器内置板卡或芯片的电路信号产生了不小的影响,最终影响了服务器的正常稳定工作。
★服务器故障排错的步骤: 1. 恢复系统缺省配置 a:硬件配置:去除标配备件(去除第三方厂商备件和非标配备件)。 b:资源配置:清除CMOS,恢复资源初始配置。 c: BIOS,F/W,驱动程序:升级最新的BIOS,F/W和相关驱动程序。 d: TPL:扩展的第三方的I/O卡属于该机型的硬件兼容列表(TPL)。
2. 从简单到复杂 a:系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变 化并处理。 b:硬件上逐一排除:逐一更换排除硬件故障点,直到找到真实故障点现实。 c:软件上从操作系统到进程:指从基本操作系统开始逐步到现实系统为止。
3. 更换对比 a:在最大可能相同的条件下,交换操作简单效果明显的部件。 b: 交换NOS载体,既交换软件环境。 c:交换硬件,既交换硬件环境。 d:交换整机,既交换整体环境。 |