iT邦幫忙

0

Raid 5 Rubild 失敗造成檔案毀損

公司檔案主機之一,Raid 5 / 硬碟*4,故障1顆,因此我換上去
(Promise Raid Card)

這是常見、簡單的作業,但是.........
在Raid自動Rebuild過程當中,跑到31%就停住了(開啟Promise Raid Manager查看進度狀況,不需操作),整台電腦變卡卡
(換上去的硬碟有相容,無異常,雖同品牌同容量不同批號)

確認過沒當機,但也不能讓他永遠卡著,等了很久,真的沒進展~~也無法os重新開機....
只得把他Reset,開機完成後發現檔案很多毀了
再檢查一次Raid,發現換上去的硬碟已經不見-->老硬碟原本就不佳,就回到4顆少1顆狀態,ok才是,只是不能再壞!

我的問題是:分割表正常、檔案及目錄毀損,有哪些好用能用的拯救軟體?
chkdsk等軟體可以,但跑不完就跳離,dos下也一樣
檔案拯救軟體因上述原因,看得見卻無法救回檔案。

看更多先前的討論...收起先前的討論...
kolom iT邦好手 1 級 ‧ 2014-02-12 11:54:40 檢舉
Sorry!我是不知道能用什麼軟體救,
我是要討論的是 原來Raid5 也不是很安全是嗎?
如果是 Raid 卡壞了,是不是所有資料都死了.
CalvinKuo iT邦大師 7 級 ‧ 2014-02-12 12:05:47 檢舉
若RAID卡組成的資訊有寫到HD,基本上按原安裝順序接就正常...
因為我壞過IBM X346 & X3550 的主板 (RAID卡是類似DIMM插上去),RAID都正常...

最近手氣很差...
Intel ICH9R RAID5 三顆壞一顆離線,沒換重新連線Rebuild搞到整個RAID掛掉...還好重要資料有備份。
fdlintw iT邦研究生 4 級 ‧ 2014-02-12 12:10:39 檢舉
raid卡好像是不能隨意更換的吧!

除非是同型號的卡
summertw iT邦好手 1 級 ‧ 2014-02-12 12:15:17 檢舉
若確定是Raid卡壞了,只要去買一塊同型別的Raid卡,插上機器,它會自動找回你原保留在硬碟裡的RAID記錄並覆蓋掉卡裡的記錄的..
但前題是,要確保你的RAID硬碟至少有兩顆是正常的,否則就無解了。
kolom iT邦好手 1 級 ‧ 2014-02-12 12:38:59 檢舉
我去年有用華碩的主機板做Raid 5 做完還試試看 把其中一顆硬碟換掉..多還好很正常..
試做完後 忘記用原主機板刪除 Raid5 的功能.
然後這顆硬碟 放到別的主機板 竟然不能用了...都無法刪除資料..
這棵硬碟就這樣鎖死了...最後沒辦法才又去找了一塊同型號的主機板重建Raid5 然後再刪除.
這樣才能回復...這樣看好像資料很安全..但是問題來了...如果我再也找不到同型號的主機版 那硬碟死了 資料不就也死了嗎?
weiclin iT邦高手 4 級 ‧ 2014-02-12 12:44:57 檢舉
RAID只是給你容錯, 不是給你做備份
tom6507 iT邦大師 1 級 ‧ 2014-02-12 14:57:16 檢舉
如果真的是很重要的資料,建議還是丟給硬碟救援廠商來做,糖大如果有在看小弟的臉書的話,應該知道去年小弟曾經服務過的單位也發生過raid掛掉的事件,因為資料太多太重要(加上又沒備份),所以送硬碟救援廠商最保險
小成 iT邦高手 10 級 ‧ 2014-02-12 15:25:53 檢舉
先用WINHEX將所有硬碟DUMP出來...
越多嘗試越嚴重,特別是CHKDSK...基本上有資料需要救援的時候就不該用CHKDSK做嘗試...
然後ZAR可以試,但都是付費軟體...
http://www.osslab.com.tw/Storage/Data_Recovery/Theory/Raid_Recovery

然後同意小狐狸說的,重要資料還是送救援...
James iT邦大師 7 級 ‧ 2014-02-13 09:21:23 檢舉
前陣子也遇過排線背板故障不穩定的問題,還好是新機沒上線前就發現了。
現在慢慢意識到,SERVER愈來愈便宜也代表SERVER機乎不會壞的美好年代已經過去了。
為了保持必要的可用性,勢必要建立更多的redundant,可是愈多的redundant就是愈高的系統複雜度,當災難範圍超出redundant保護計畫時也就愈難以回復。
這是不是代表愈安全的系統就愈危險。搖頭
現在的HD根本不可靠
所以我都備很多份重要的資料
兄弟好意見~我正在用WINHEX,dump成一個img之後,再慢慢從img找資料
我會另外做一個完整分割區備份起來,選BESR好了

Raid就直接重作。
這是當然的,我也要檢討備份環境~
備份採取同步,因此備份的資料也跟著小損害,要增加一份才行。
weiclin提到:
RAID只是給你容錯, 不是給你做備份

IT新進要記住!!

我這狀況,RAID有發揮功能:(故障一顆,資料沒事)
只不過RAID Rebuild不知原因把資料弄壞,應該說是弄亂,資料都還在卻讀不出來。
小成 iT邦高手 10 級 ‧ 2014-02-13 16:04:52 檢舉
ZAR可以直接載入多顆硬碟的IMAGE來做RAID5的資料救援
GJ iT邦研究生 5 級 ‧ 2014-02-14 11:02:42 檢舉
RAID rebuild 不回去
就可趕快考慮備份重建了
之前是NAS遇過
重建後RAID 還建不起來卡在進度50%
全換新硬碟還是卡住
送給原廠測,結果是RAID晶片掛了....Orz
tom6507 iT邦大師 1 級 ‧ 2014-02-14 11:13:37 檢舉
說實在的,Raid的精華完全就在那塊卡上,所以只要Raid卡好,硬碟什麼的就不是問題了,還是不要貪便宜比較實在
GJ iT邦研究生 5 級 ‧ 2014-02-14 11:57:56 檢舉
當初因為costdown 只好買這台窮
至少也用了三年,折舊完了掰掰
waztwyws提到:
RAID rebuild 不回去
就可趕快考慮備份重建了

啊,你說的就是我的狀況,問題是,她已經自行出事了,哪能備份哩??

嗯,這次事件後,我讓她退役吧~
Promise Raid Card,便宜好用,壽命大約7年(也不是壽命,剛好出狀況+規格淘汰),夠本了
GJ iT邦研究生 5 級 ‧ 2014-02-14 13:29:48 檢舉
我的狀況是檔案及目錄都還正常
所以可以備毆飛
你的建議最好,改丟到回答啦

我正在嘗試ZAR,demo版只看得見、救援圖片檔,真是火大><

1 個回答

24
summertw
iT邦好手 1 級 ‧ 2014-02-12 12:07:45
最佳解答

我這裡年11月也發生一件,狀況與樓主類似..
在此提供我把資料救出的步驟與方法,供各位朋友參考之。
...
機器:HP DL380G6/Read5/5顆硬碟。
OS:Windows 2008/角色為:AD/DC。
狀況:一顆硬碟故障,但無法開機(估計,應有第二顆硬碟有問題,只是燈號正常而已)。
...
1.在嘗試三次開機失敗後,就停止再嘗試,以免資料損毀擴大。
2.在確定Raid5記錄仍完整的保留在Raid卡裡時,我使用了先前就預備好的Windows8姆指碟開機。
3.完成開機後,將所有資料都Copy出來,當然如我所料,有極少數的檔案損毀無法複製。
4.完成檔案救出後,剩下的工作就較簡單了,如重作Raid5/重新安裝伺服器/重新啟動AD......等等。
...
以上為個人救援且有AD的機器之經驗,提供給樓主及各位參考,希望對一家有幫助。

看更多先前的回應...收起先前的回應...

有用XPE開機嘗試過,一樣,多數檔案正常,少數資料因為毀損無法複製出來

正是卡在這裡

我這部是DC Member,2003,不過暫時與此無關,OS正常

hon2006 iT邦大師 1 級 ‧ 2014-02-12 12:38:23 檢舉

雖然有raid 還是要作備份
目前用過最好的是這個
http://www.partition-recovery.com/

mwu4 iT邦新手 2 級 ‧ 2014-02-12 14:05:09 檢舉

請教summertw大大,是否Windows 8可直接認得HP DL380G6的RAID卡?因伺服器內建的RAID卡,有時需要廠商提供的驅動程式;Windows 8要如何認得特殊的RAID卡,以取得硬碟內資料?
謝謝。

summertw iT邦好手 1 級 ‧ 2014-02-12 14:41:26 檢舉

HP DL380 G6的Raid卡,Windows 8可直接驅動,不需額外的驅動程式..
伺服器內建的,可看一下它是使用那塊晶片,大部份應該都可以讀的到才對..
若是特殊的Raid卡,可依廠商提供的網址去下載(或Google找找看)..
用Windows 8姆指碟開機後,再安裝驅動程式,然後重新開機即可。

tom6507 iT邦大師 1 級 ‧ 2014-02-14 11:17:20 檢舉

DC Member應該不需要天天同步備份,一周一次就很夠用了,所以糖大確實要重新調整備份機制,這樣也可以省下一些磁帶XD。

這不是最佳解答、符合我的作法,而是只有這個回答讚
補充說明如下:
RAID5故障一顆並不影響資料,我的狀況在於『分割表正常,只有部份檔案及目錄毀損』
因此不適用任何磁碟救援、檔案救援,因為就算看得到、救得到也無法使用

在此過程中,最有效的修復方式是:chkdsk,因為是Windows/NTFS,並非如很多人所說:不要用chkdsk修復、會擴大問題。
只要跑過chkdsk,正常的檔案就越來越多,可惜因為問題很大、每次都跑不完跳離,要一直重複跑chkdsk才行

最後的處理方式,是從既有二個備份(因為採取同步,還是有資料被毀損的覆蓋掉)中撈資料、逐一檢驗,耗時卻有效
如果當初沒有二個備份,問題就更大了~~
我打算增加一份備份,備份不嫌多。

我要發表回答

立即登入回答