一直有個疑問,
當組成RAID的某顆硬碟有壞軌或檔案系統部份損壞時,
這些錯誤的資料隨著RAID機制寫到其他硬碟,
等到某天偶然發現有些檔案要用卻已毀損時,
就連回覆的機會都沒有了。
所以若要保護資料的話,只有"備份"才比較實用,
若如此,raid只能防hd實體故障而已,是嗎?
但以現在hd硬體的低故障率來看,
還有必要投資建RAID嗎?
真要能保護資料,
是不是不如投資強大的備份設備更有意義呢?
(如即時備份備援,異地備份備援)
在 RAID 有一基本概念稱為
EDAP ( Extended Data Availability and Protection ) ,
其強調擴充性及容錯機制,
也是各家廠商如:
Mylex,IBM,HP,Compaq,Adaptec,Infortrend等訴求的重點,
包括在不需停機情況下可處理以下動作:
應該可以解答您的問題: RAID確實可以保護資料, 除非您鴻運當頭, 連壞兩顆以上硬碟才會造成資料損失.
我就曾遇過一次掛兩顆
沒有天災人禍
對方也只能摸摸鼻子 吞下去
所以後來公司就要求 每月幫客戶備份 6個月一輪
不管你作 RAID 幾,有沒有spare,作備份是一定要的啦.
RAID和備援是兩個不同思考方向...
RAID考慮的是線上資料儲存機制的完整....
備援是最後一道防線, 當RAID設備失敗時的補救措施.
我們要確保RAID運作正常, 然後希望備援永遠不會有用到的一天....
但若是我的即時備援做好了,
又何必在乎"線上資料儲存機制的完整"
因有即時備援的話,
線上HD掛了並不會造成停機,
線上主機硬碟替換也不需停機,
這樣還要多花$建raid嗎?
更何況現在會遇到的狀況
大多是像tombo大大說的:
"Program Crash 造成資料錯亂"
所以是不是不如集中$力建即時備援!!
這就是在下的提問原意~
@utopia
你的即時備援的設計是什麼?如果是從成本上考量,會不會你所謂的「即時備援」要遠比Raid加備份要多很多?
我所謂的即時備援就是像platespin或double-take那樣的產品(或其他server load balance的機制),可在主機掛點時立即接手服務,這樣成本或許比Raid加備份較高,但是好處和實用性卻多於Raid加備份
可惜實務上還是以 $ 為依歸.
能符合市場期待的C/P值的解決方案,才能大賣.
看了這麼久
我猜測樓主的意思是不是
把方案一的錢省下來去做方案二?
方案一:RAID5+磁帶備份
一部電腦和5顆硬碟
方案二:不RAID+磁帶備份
兩部電腦組成cluster,兩部電腦都只用一顆硬碟就好
不過我在想,一般導cluster或是failover的一些solution的,也還是會做raid和備份。就像raild還是有硬碟同時掛的風險,兩台cluster萬一一齊同赴黃泉,那...
![]()
其實最近Amazon發生「雲端垮下來」的事件,應該也讓人有些警惕,以他們技術之高,人員之多,還是會發生這樣的事
對,差不多就是antijava大大
說的這種思考方向,
只是傳統一向認為RAID是第一線最基本要做的,
但現在像Program Crash 造成資料錯亂
這種事愈來愈多時(機率大過hd掛點),
raid常常是無能為力,
終究要靠備份去回復,
所以若有cluster + snapshot備份,
在預算有限的狀況下,raid是不是可以犧牲掉了!
不應該再被當第一線最基本要做的
反而是當成有$時再來"加保險"的事!
utopia提到:
像Program Crash 造成資料錯亂
我不懂版大的論點, Program Crash造成的問題跟RAID不RAID有什麼關係?
Program Crash有可能是記憶體出狀況. 這樣有再好的備份, 也沒用.
預防Program Crash是要在Program開發過程中對軟體品質嚴加控管的, 跟用不用RAID一點關係都沒有.
我相信, 版大應是找不到不用RAID的Server了.
simon大說的也沒錯,
只是MIS對Program開發過程通常無能為力
尤其是前朝留下的"孤兒系統"
在資料異常的真正原因未查明前,
user或老闆要的通常是"快速還原正確資料"
這時有snapshot備份比起有RAID要幫忙多了
所以才會覺得RAID這傢伙好像很少起作用!
不像傳統觀念那麼有必要性!
utopia提到:
user或老闆要的通常是"快速還原正確資料"
這時有snapshot備份比起有RAID要幫忙多了
所以才會覺得RAID這傢伙好像很少起作用!
不像傳統觀念那麼有必要性!
就這段描述的情況
再加上「程式crash造成資料錯亂的機率遠高於硬碟故障」的前提
我也覺得建置RAID的優先次序可以在備份後面
就你的立場來看
RAID的著眼點在於Availability
備份的著眼點則是Recovery
而現階段的優先次序是Recovery大於Availability
但是如果你說「RAID對資料保護沒作用」
還是無法獲得許多邦友的認同
其實,許多IT技術只是方向和用途不一樣
沒有對或錯,
只要選擇對自己最有利的架構就好了
我想
等到碰到一次硬碟故障
而手邊的備份資料沒地方可用時
再回頭來檢討RAID的重要性就可以了![]()
這段討論讓我聯想起敝公司的工程師
在他心目中
沒有什麼Full Backup,Incremental Backup,..blah blah blah
天下只有一種Backup solution
就是Ghost
不管任何作業系統、資料庫、應用程式
一律萬佛朝宗,Ghost起來再說![]()
什麼Recovery?沒聽過
來!讓我把你Ghost回去再說![]()
亞洲企業管理者對於IT認知的常態...沒發生事情就認為他不會發生...直到發生了才來檢討要不要作備份...然後時間久了,就開始循環。
要作到兼具效率的優異效果不難,錢砸下去就有了,重點是企業重視該區域的程度,以及投資報酬率問題,所以要作風險評估,然後決定備份的安全等級...
事事無絕對,哪天一個小意外,整棟建築物燒掉、倒掉,就算你的設備再好,也還是掛掉...所以會有異地備援...
反正,重點是要先風險評估,然後再決定投入的備份成本,如果單只想靠RAID,那就祈禱哪天不要給你同時掛兩個,誠如我跟其他人說的:「電腦這東西最喜歡掛在你最不想他掛掉的時候」。
這個標題下得可能有些聳動,不過其實是為了引起大家思考:在大家當MIS的歷程中,主機發生問題時,到底是那些設備常常救了自己~~
是RAID? SnapShot備份? 備援? ghost? 那種工具救你最多次?
你會感謝好在有"XX"?
如此未來在建構新的資訊環境時,"XX"是否就應列為首要基礎必備建設
而不是像現在RAID幾乎成了公認基礎必備建設,
(但實用上卻很少讓人感覺它的存在助益性,請回憶你曾講過幾次"好在有RAID"?)
當然我絕非否認RAID的Availability,
只是RAID在資訊建設的優先順位是否該退位了呢?
raid組成要看你是用那一等級,除了raid 0外其他組成在hdd有壞軌或是異常就不會寫入會跳開並警告,raid並不像你說的那麼無用,
即時備份備援,異地備份備援是防止原有地點發生火災,地震或是資料誤刪可還原用的,
其實資訊設備都會有其風險性,你要做到營運不中斷水準(BCM)中定義資訊服務水準(SLA)為99.9%後面是要幾個9,你就會清楚描明白到底你要花多少錢做多少事了。
我覺得RAID和備份是不同的,我目前重要的File Server是RAID 0+Tape備份,Raid 0是避免硬碟一顆掛點時,還還一顆能正常提供服務和提供資料(同時包括系統和資料),Tape備份只備資料,對我來說是雙重保障,RAID是第一層,Tape是第二層
現在hd硬體的低故障率
這太難說了,雖然我還是用SAS HD,但我的File Server至少要再用六年以上,雖然SAS HD很耐用,但這也只機率問題
是不是不如投資強大的備份設備更有意義呢?
是啊,但公司沒錢,RAID 0+Tape是最省了
備份還原需要時間,而問題發生時,MIS最沒有時間
我的看法:
Raid用來做系統最好,保持系統常態運作,至於資料的部分;呵呵....最好不要
資料的部分可以用Ghost備分,就很安全了
以免Raid到最後,系統+資料=雙掛號就慘了,這是我的經驗
其實,以前會用RAID或SCSI是因為CPU及主機板的外頻速度都很慢,現在都用SATA3了,還需要RAID嗎?
RAID 1 可以達成備份效果 (RAID 0 是加速)
如果是大型伺服器的話可以用到RAID 5(加速+備份 至少要3顆HDD)
至於有沒有必要就要因機器功能而定了
一般家用 server(動物機,webSV,...)用量不大的沒有raid 1 -->大不了備份重裝(用異地備份,但是如果網路不快的話也可以寫支script 資料copy到usbHDD內也行)
公司用的 raid 1(5) + 異地備份 會比較安全些
很重要而且不能停的那種 raid 5(HDD需要hot swap) + 異地備份(兩處以上) 會比較安全
其他的raid 可以參考 http://zh.wikipedia.org/wiki/RAID
Ghost也是不錯的方法~我記得有線上即時Ghost server(記得把系統跟資料分開放,要不然很慢,缺點是他備份要停機備份,raid不用停機就在備份了)
raid不只是保護資料,還有效率問題。當server有硬碟掛了時,可以馬上更換硬碟。
當然平時資料還是要備份,畢竟資料是無價的。
是誰講有 RAID 就不用備份了嗎?
備份與 RAID 防範的是不同的層面,
如果你今天備份的 Data 是存在硬碟裡,總有一天它的壽命也會到頭,備份的資料也會完蛋
同樣的太依賴 RAID ,如果遇上沒有權限管理、稽核機制的話,使用者亂刪亂改資料,或是 Program Crash 造成資料錯亂,那也是完蛋。
tombo大大誤會了,
我應該是想說:
有即時備援就不用RAID了~~
因tombo大大說的正是我想強調的,
現今系統中斷和資料有問題,
其實很少是HD故障所致,
反而是大大說的"Program Crash 造成資料錯亂"
比較大宗,
所以若是我的即時備援做好了,
根本就不怕有HD掛了,也不怕停機,
這樣還要多花$建raid嗎?
不如投資完善的即時備援就好了!
utopia提到:
即時備援
投資金額和RAID磁碟櫃相比, 可能大筆的錢才發現, 再怎麼即時, 還是會有至少一個小時以上的服務中斷時間.
基本上, 一套完善的即時備援系統, 可能是整個機房的投資金額再加倍.
如果真的要考慮. 或許版大應該去看看HA(高可用度)這個課題, 而不是看備援.
simon581923提到:
投資金額和RAID磁碟櫃相比, 可能大筆的錢才發現, 再怎麼即時, 還是會有至少一個小時以上的服務中斷時間.
應該要先做風險管理。
任何防護都是這樣,當防護到達一定程度後,投入大量資金,成效不一定顯著,
做過風險分析之後,才能知道資金投入哪個防護比較有明顯效益。
除非公司完全無法接受系統停機,要不然也很少公司會花錢做到 99.999% 的防護...
RAID(Redundant Array of Independent Disks)
顧名思義,將磁碟組合成陣列,提供較快的存取速度與一定的硬體容錯
最常用到的就是RAID0,RAID1,RAID5這幾種架構
但實做RAID環境並不表示可以不用備份,這是兩種不同的資料保護策略
如同樓上的說到,要同時掛2顆不是沒有機會
備份是將資料留存,以備不時之需,磁碟陣列是一定程度的保護線上系統/資料
至於做法就端看至於企業可忍受斷線時間與付出成本取得平衡點囉
另外因硬體網路架構的普及(就是設備相對以前便宜)
近年大家也對於DR(Disaster Recovery)異地備援的討論也越來越夯
DR讓服務無中斷的夢想有機會達成,當正常運作環境掛點,可迅速的透過網路的切換,
導向異地備援系統接手服務,IT單位才有相對的時間維修故障的系統環境.
**保險一定會用到嗎 ?
如果用到保險,保到甚麼程度才會夠?
保的程度就看你的財力及能力.**RAID的種類很多, raid 1 算企業的強制責任險,是最低要求.
如果可以,最好準備完全相同主機板,避免主機板壞了但raid 沒壞.
如果財力允許,最好準備完全相同伺服器主機一台, 緊急狀況發生馬上可以復元,
因為備份還原軟體等,有時要考驗你的功力,新硬體DRIVERs都要重新安裝,還是有一些許風險,當然以上談到的軟硬體都具備 ,就是100% 保險.
現在hd硬體的低故障率
現在的故障率比以前高很多很多吧~
有即時備援就不用RAID了~~
即時備援跟RAID是兩個不同的東西,目的也不同,要拿來取代RAID也不是一定不行,但在實際運用上還是有所差異,耗耗的資源也不同。我個人認為兩個都要做,不是說做好了即時備援就可以不用RAID,這不是單純資料問題或HD故障的問題,而是整個企業資訊系統管理的問題。
RAID有分軟體跟硬體架構
一般都建議用硬體架設
事實上WINDOWS有內建架設的程式
不過連它本身在你安裝的時候都不建議使用軟體
一般看你要架多少硬碟.有分以快速或是安全性為考量
依照你的需求如果要安全一點.資金又充足的話就架RAID5.
這樣一次要兩顆硬碟壞掉..資料才會消失
不然就看需求架RAID0或1
原RAID應該設定為RAID 1(Mirror),Mirror基本上很簡單設定時(詳細步驟參考RAID卡的使用手冊),
最重要的是Mirror的"方向",Source當然是有資料正在使用的那顆硬碟,Target當然是新的硬碟,
1.一般來說 Raid 是容許Disk的故障的保護,
如果誤刪data 還是沒救還是需要備份軟體將誤刪的資料回覆
2.cluster 是主機端的容錯,允許一台或多台主機的硬體故障
如果data有問題 cluster 也是沒辦法保護的
3.所以當你使用的Raid 後你還是需要做備份或者是備援來保護重要的data
Raid can protect data with proper setup + Storage deployment.
NetApp Unified SAN storage : 2xunits, Raid-4 (Raid-DP) with NDMP backup protocol. First unit--Snap shot then Snap mirror to 2nd unit. NDMP backup from 2nd unit (LAN free and Server free) to Tape Library directly by NBU 6.0. It is a good solution to enable in the majority of high SLA requested environment (99.9% above).
1.資料的備份是絕對需要,馬虎不得;
2.RAID 上的 HDD 有壞軌:RAID 應該要發出告警,正確的說,負責 RAID 的 storage system 要告警;如果沒有,請問品牌?應該沒人敢用..高檔的 storage system 不用等磁碟壞,磁碟只要工作狀態和標準數據落差到一定程度,就告警了;
3.檔案系統壞掉:那是檔案系統要通知 OS 發出告警;如果沒有,請問是哪種檔案系統?也沒人敢用了..這就是為何好的檔案系統不容易設計,因為要兼顧安全和效能;
4.同上幾位所述,RAID 還有提昇效能的用途..正確的說,好的 storage system 能大幅增進 "某些狀況" 下的使用效能;
5.經濟拮据?就算你現在用 PC 來當 server,多個 mirror 不過多顆 HDD 的錢..不會連新台幣幾千元都沒有吧...