本日の Sun Blade 1000 (900MHz x2)の最近のブログ記事

ディスク 1 個、failed しますた

| トラックバック(0)

快調に動いている SAS3041X-R 搭載の Blade 1000 ですが、昨日、ログインできなくなりますた。
ping には反応するものの、やっぱりログインできず。
どうしようもないので、電源落として再起動。
あらら、RAID Volume を構成している 3 台の disk のうち1個が FAILED になってますよ・・・
こいつが原因ですか? ってゆーか、1個壊れても動き続けないといけないんじゃないんですか!
むぅ。

でも、messages ファイルに、何も記録されてないんだよなー・・・
raidctl でみると確かに、FAILED になって、degraded になってるんですけど。
で、復旧させる方法ですが、電源落として disk 交換して再起動するということになりますが、換えのディスクなどなく・・・

確認のため、LSI logic の itmpt driver をインストールした環境を起動。
lsiutil でみると、やっぱり failed になっている。
とりあえず、exper tmode で、failed になっている disk を offline にし、それから online にしてみると、failed だったのが正常なディスクとして認識され、resync が開始されてしまいますた orz
うむむ、とりあえず様子見で orz

resync 完了後のメッセージ
--
May  9 12:15:12 empress scsi: [ID 107833 kern.notice] /pci@8,600000/LSILogic,sas@1 (mpt0):
May  9 12:15:12 empress         Physical disk 1 (target 1) is |online|
May  9 12:15:12 empress scsi: [ID 107833 kern.notice] /pci@8,600000/LSILogic,sas@1 (mpt0):
May  9 12:15:12 empress         Volume 0 is |enabled||degraded|
May  9 12:15:12 empress scsi: [ID 107833 kern.notice] /pci@8,600000/LSILogic,sas@1 (mpt0):
May  9 12:15:12 empress         Volume 0 is |enabled||optimal|
--

Online CPU Diagnostics Monitor Version 2.0

| トラックバック(0)

邪魔にならないような時間に 、stress test を実行し、CPU に異常がないかどうか logging するもの。 UltraSPARC-III, IV family に対応。 http://www.sun.com/download/products.xml?id=42de1472

 

cpudiagd なんてゆーのが動いて、15分毎(default)に test を実施してくれる。

--

 04/05/06 17:18:03 empress cpudiagd(2.0).info:
     Start Test (5) :/usr/platform/sun4u/sbin/sparcv9+vis2/cputst -s 2 -n
04/05/06 17:18:06 empress cpudiagd(2.0).info:
     End Test (PID=5456) Time: 0H.0M.3S.379Msecs    (-s 2)  
--

log は /var/cpudiag/info/info.log に。

異常が見つかった場合は、任意のコマンドを kick できるようにもできるみたい。

122165-02: Hardware/1064_FCode Sun Fire T2000 1064 FCode update

| トラックバック(0)

SAS3041X-R の FCode のパッチがリリースされてました。 修正内容は、volume を mix した場合の不具合? まぁいいや。というわけで、raidctl で firmware を流し込んで 1.00.39 → 1.00.40 へ。

 

         Node 0xf00972a4

            firmware-version:  '1.06.00.00'
            mpt-version:  '1.05'
            assigned-addresses:  81000810.00000000.00000400.00000000.00000100.83000814.00000000.00104000.00000000.00004000.8300081c.00000000.00110000.00000000.000100
00.82000830.00000000.00200000.00000000.00200000
            compatible: 'pci13e9,50' + 'pci1000,50' + 'AAPL,MPT'
            model:  'LSI,1064'
            reg:  00000800.00000000.00000000.00000000.00000000.01000810.00000000.00000000.00000000.00000100.03000814.00000000.00000000.00000000.00004000.0300081c.000
00000.00000000.00000000.00010000.02000830.00000000.00000000.00000000.00200000
            version: '1.00.40'
            wide:  00000010
            device_type:  'scsi-2'
            name:  'LSILogic,sas'
            fcode-rom-offset:  00000000
            66mhz-capable:  
            devsel-speed:  00000001
            class-code:  00010000
            interrupts:  00000001
            latency-timer:  00000040
            cache-line-size:  00000010
            max-latency:  0000000a
            min-grant:  00000040
            subsystem-id:  00003020
            subsystem-vendor-id:  00001000
            revision-id:  00000002
            device-id:  00000050
            vendor-id:  00001000

            Node 0xf00a2a78
                compatible: 'st'
                device_type:  'byte'
                name:  'tape'

            Node 0xf00a380c
                compatible: 'sd'
                device_type:  'block'
                name:  'disk'


: Twitter Updates

    follow me on Twitter

    ウェブページ

    タグクラウド

    Techonrati

    Technorati search

    » リンクしているブログ

    Powered by Movable Type 4.23-ja