linux – SLES 10 SP4(x86_64) – HP Proliant DL380 G4

将HP Proliant DL380 G4从SLES 10 SP2(i586)升级到SLES 10 SP4(x86_64)时遇到了不幸.尽管安装顺利完成,但服务器在正常运行几天后仍无响应.服务器响应PING但SSH甚至控制台访问失败.恢复的唯一方法是冷启动服务器.

当服务器无响应时,syslog不会显示任何日志.在搜索时,我可以看到针对各种Linux版本报告的类似实例,通常可以通过升级BIOS和/或服务器的固件来解决.

还在启动选项中尝试了acpi = ht和acpi = off,但没有成功.

我已经升级了HP护照站点 at this link提供的服务器BIOS版本,但这并没有解决它.

然后我尝试从here 升级存储控制器的固件

我已重新启动服务器并等待查看是否可以解决问题.关于什么是根本原因以及如何修复它的任何建议/建议？

我可以找到一个非常接近我所看到的Ubuntu 12.04 – HP ProLiant DL380 G4 – Load Maxes Out / Unresponsive的帖子

服务器信息：

Linux hostname 2.6.16.60-0.85.1-smp #1 SMP Thu Mar 17 11:45:06 UTC 2011 x86_64 x86_64 x86_64 GNU/Linux

> lscpu
Architecture:          x86_64
cpu(s):                4
Thread(s) per core:    2 
Core(s) per socket:    1
cpu socket(s):         2
NUMA node(s):          1
Vendor ID:             GenuineIntel
cpu family:            15
Model:                 4
Stepping:              1
cpu MHz:               3200.225
L1d cache:             16K
L2 cache:              1024K


> modinfo cciss
filename:       /lib/modules/2.6.16.60-0.85.1-smp/updates/cciss.ko
license:        GPL
description:    Driver for HP Smart Array Controllers version 3.6.28-24 (d927/s1461)
author:         Hewlett-Packard Company
srcversion:     737C49390DD1F6FB9BC03F7

>slabtop
 Active / Total Objects (% used)    : 331966 / 339552 (97.8%)
 Active / Total Slabs (% used)      : 20306 / 20315 (100.0%)
 Active / Total Caches (% used)     : 98 / 136 (72.1%)
 Active / Total Size (% used)       : 78133.61K / 79253.95K (98.6%)
 Minimum / Average / Maximum Object : 0.02K / 0.23K / 128.00K

 OBJS ACTIVE  USE OBJ SIZE  SLABS OBJ/SLAB CACHE SIZE NAME
 191752 191637  99%    0.09K   4358       44     17432K buffer_head
 44916  44891  99%    0.20K   2364       19      9456K dentry_cache
 35620  35561  99%    0.78K   7124        5     28496K ext3_inode_cache
 15064  15035  99%    0.52K   2152        7      8608K radix_tree_node
  6510   5859  90%    0.18K    310       21      1240K vm_area_struct
  5782   5689  98%    0.06K     98       59       392K size-64
  3840   3747  97%    0.08K     80       48       320K sysfs_dir_cache
  3288   3271  99%    0.61K    548        6      2192K proc_inode_cache
  3015   2259  74%    0.25K    201       15       804K filp
  2304   2043  88%    0.02K     16      144        64K anon_vma
  2304   1911  82%    0.02K     16      144        64K dm_tio
  2208   1899  86%    0.04K     24       92        96K dm_io
  2106   2096  99%    0.58K    351        6      1404K inode_cache
  1710   1633  95%    0.12K     57       30       228K size-128
  1680   1515  90%    0.03K     15      112        60K size-32
  1480   1169  78%    0.09K     37       40       148K journal_head

任何指针将不胜感激.

解决方法

早在2003 – 2006年,我就有许多HP Smart Array 6400/641 / 6i SCSI RAID控制器与Red Hat / CentOS系统挂起.你正在失去RAID控制器和底层存储系统. I / O停顿甚至控制台登录失败,因为操作系统无法从磁盘读取.网络堆栈在内存中,因此系统响应ping.

其中一些是司机互动.其中一些只是因为这些系统并不适用于今天的操作系统.除了使用更现代的硬件(或者可能购买另一个单元for $18 on eBay进行测试)之外,没有其他选择.在那个时代,我的所有服务器都没有发生这种情况,但肯定会比其他服务器受到更多影响.

没有固件更新,如last revision is from 2008.系统BIOS也在2008年停止接收更新.不支持此存储问题或服务器硬件的任何方式.

DL380 G4是一款拥有10年历史的古老技术服务器(PCI-X,Ultra SCSI等).您是否期望支持该年份的桌面？

见：HP Proliant DL380 G4 – Can this server still perform in 2011?

linux – SLES 10 SP4(x86_64) – HP Proliant DL380 G4 – 随机变得无响应

解决方法

猜你在找的Linux相关文章