将HP Proliant DL380 G4从SLES 10 SP2(i586)升级到SLES 10 SP4(x86_64)时遇到了不幸.尽管安装顺利完成,但服务器在正常运行几天后仍无响应.服务器响应PING但SSH甚至控制台访问失败.恢复的唯一方法是冷启动服务器.
当服务器无响应时,syslog不会显示任何日志.在搜索时,我可以看到针对各种Linux版本报告的类似实例,通常可以通过升级BIOS和/或服务器的固件来解决.
还在启动选项中尝试了acpi = ht和acpi = off,但没有成功.
我已经升级了HP护照站点at this link提供的服务器BIOS版本,但这并没有解决它.
我已重新启动服务器并等待查看是否可以解决问题.关于什么是根本原因以及如何修复它的任何建议/建议?
我可以找到一个非常接近我所看到的Ubuntu 12.04 – HP ProLiant DL380 G4 – Load Maxes Out / Unresponsive的帖子
服务器信息:
Linux hostname 2.6.16.60-0.85.1-smp #1 SMP Thu Mar 17 11:45:06 UTC 2011 x86_64 x86_64 x86_64 GNU/Linux > lscpu Architecture: x86_64 cpu(s): 4 Thread(s) per core: 2 Core(s) per socket: 1 cpu socket(s): 2 NUMA node(s): 1 Vendor ID: GenuineIntel cpu family: 15 Model: 4 Stepping: 1 cpu MHz: 3200.225 L1d cache: 16K L2 cache: 1024K > modinfo cciss filename: /lib/modules/2.6.16.60-0.85.1-smp/updates/cciss.ko license: GPL description: Driver for HP Smart Array Controllers version 3.6.28-24 (d927/s1461) author: Hewlett-Packard Company srcversion: 737C49390DD1F6FB9BC03F7 >slabtop Active / Total Objects (% used) : 331966 / 339552 (97.8%) Active / Total Slabs (% used) : 20306 / 20315 (100.0%) Active / Total Caches (% used) : 98 / 136 (72.1%) Active / Total Size (% used) : 78133.61K / 79253.95K (98.6%) Minimum / Average / Maximum Object : 0.02K / 0.23K / 128.00K OBJS ACTIVE USE OBJ SIZE SLABS OBJ/SLAB CACHE SIZE NAME 191752 191637 99% 0.09K 4358 44 17432K buffer_head 44916 44891 99% 0.20K 2364 19 9456K dentry_cache 35620 35561 99% 0.78K 7124 5 28496K ext3_inode_cache 15064 15035 99% 0.52K 2152 7 8608K radix_tree_node 6510 5859 90% 0.18K 310 21 1240K vm_area_struct 5782 5689 98% 0.06K 98 59 392K size-64 3840 3747 97% 0.08K 80 48 320K sysfs_dir_cache 3288 3271 99% 0.61K 548 6 2192K proc_inode_cache 3015 2259 74% 0.25K 201 15 804K filp 2304 2043 88% 0.02K 16 144 64K anon_vma 2304 1911 82% 0.02K 16 144 64K dm_tio 2208 1899 86% 0.04K 24 92 96K dm_io 2106 2096 99% 0.58K 351 6 1404K inode_cache 1710 1633 95% 0.12K 57 30 228K size-128 1680 1515 90% 0.03K 15 112 60K size-32 1480 1169 78% 0.09K 37 40 148K journal_head
任何指针将不胜感激.
解决方法
早在2003 – 2006年,我就有许多HP Smart Array 6400/641 / 6i SCSI RAID控制器与Red Hat / CentOS系统挂起.你正在失去RAID控制器和底层存储系统. I / O停顿甚至控制台登录失败,因为操作系统无法从磁盘读取.网络堆栈在内存中,因此系统响应ping.
其中一些是司机互动.其中一些只是因为这些系统并不适用于今天的操作系统.除了使用更现代的硬件(或者可能购买另一个单元for $18 on eBay进行测试)之外,没有其他选择.在那个时代,我的所有服务器都没有发生这种情况,但肯定会比其他服务器受到更多影响.
没有固件更新,如last revision is from 2008.系统BIOS也在2008年停止接收更新.不支持此存储问题或服务器硬件的任何方式.
DL380 G4是一款拥有10年历史的古老技术服务器(PCI-X,Ultra SCSI等).您是否期望支持该年份的桌面?
见:HP Proliant DL380 G4 – Can this server still perform in 2011?