我在大约18个月之前购买了1TB Seagate Barracuda 7200.12 – ST31000528AS驱动器,因为它有5年保修期,并且在Ubuntu Server下使用三星Spinpoint作为软件RAID-1阵列的一半.
昨天,smartd开始报告一个问题:
Jan 18 06:08:03 svr smartd[2672]: Device: /dev/sdb [SAT],2 Currently unreadable (pending) sectors Jan 18 06:08:03 svr smartd[2672]: Device: /dev/sdb [SAT],2 Offline uncorrectable sectors
我通过smartctl的调查来跟进这个…并且在安排了一些测试后,我得到了这些结果:
$smartctl -l error /dev/sdb smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.0.0-14-generic] (local build) Copyright (C) 2002-11 by Bruce Allen,http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Error Log Version: 1 No Errors Logged $smartctl -l selftest /dev/sdb smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.0.0-14-generic] (local build) Copyright (C) 2002-11 by Bruce Allen,http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed: read failure 10% 12451 1953523918 # 2 Short offline Completed: read failure 90% 12445 1953523918 # 3 Short offline Completed: read failure 60% 12445 1953523918 # 4 Extended offline Completed without error 00% 5532 - $
只有’自我测试’输出记录了任何类型的问题 – 尽管我不是100%清楚如何解释它.我怀疑我可能同时安排了两次短期测试……虽然我不确定为什么一个人剩下90%,另一个60%.来吧,我不明白为什么我的长测试剩下10%.
另一个奇怪的事情是Raid-1没有检测到任何类型的问题(或者,至少,这是我所理解的“[2/2] [UU]”的意思.虽然sdb上有三个分区,但只有一个不是在另外两个中,一个是启动分区(在两个驱动器之间复制以进行灾难恢复),另一个是交换.
$cat /proc/mdstat Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : active raid1 sdb3[1] sda3[0] 967843840 blocks [2/2] [UU] unused devices: <none>
几个问题…
>我认为这是sdb有错的有力证据吗?这可能是软件而不是硬件问题吗?
>我是否可以获得检测到有故障的所有块的列表 – 并确定它们所在的分区?
>我可以(我是否需要)在获得替换驱动器之前映射出这些坏扇区?
>很多人遇到1TB Seagate Barracuda驱动器的这类问题?
>有没有人知道上面的smartmontools的输出是否足以证明在保修期内确保更换?
任何建议/意见热烈赞赏……