iT邦幫忙

0

想找那一種廠商來幫助了解和改善可以推薦

  • 分享至 

  • xImage

想問各位大大(目前擔任公司MIS工程師工作),因為伺服器有一天某一台實體機無法連線,立馬查了一下是網卡掛了,導致有一台虛擬機系統故障開不起來,故緊急把網卡的網路線換到內建網卡設定(但我不會不知在哪設,是主管設定才知道),然後開了VM主機平台,打開各虛機系統其中一台開不起來掛了,因為有備份虛機整個VM檔故把整台還原只落差幾小時,也有備份資料庫但不用再另外導入,但整個事件嚇的一身冷汗,主管才指示了一堆狀況要學會和危機處理或找人來了解整個網路的架構佈置和主機的狀況能後續危機處理,目前方向想找一下專家來幫助了解和改善,因網路這塊小弟弱,該怎麼做好呢?
目前機房狀況/伺服器要了解
1.伺服器的佈建情況
2.主機,VM,各台配置狀況
3.故障的危機處理,如何很快速還原上線
4.備援和備份的狀況
5.網卡的備用(加購等)
6.NAS的狀況,速度很慢,使用量滿載/需要增加空間或接法改變.等

看更多先前的討論...收起先前的討論...
望空 iT邦新手 1 級 ‧ 2024-09-11 15:12:59 檢舉
1. 找SI廠商來做全面性評估及人力派遣作業
2. 尋找課程去做培訓
froce iT邦大師 1 級 ‧ 2024-09-11 15:24:43 檢舉
虛擬機換網卡,GUEST OS那邊會要重新設定。
自己積極的去架測試的系統,把所有系統都從頭架一遍後你一定會,看你有沒有能力去做而已。
第1、2、4、5點,都是你們公司內部的資料,問問看你主管可不可以給你。
第3點如果你有基礎能力,你可以參照F大的建議,如果沒有這些基礎能力的話,就按照望空大說的那樣,找課程去上吧。
第5點提供規格給廠商報價進行採買囉。
第6點的話,NAS慢的原因可能是長時間寫入資料,也有可能是網路問題,這個就要去NAS裡面看才會知道解法是什麼。
望空 iT邦新手 1 級 ‧ 2024-09-11 15:56:39 檢舉
正常來說有點規模的公司,對於機房問題管理都會有SOP或是參考文件,除非那些文件都非常過時,否則通常一進去該公司就要對那些文件有一定程度的了解
去SI上班三年六個月再回來
望空 iT邦新手 1 級 ‧ 2024-09-11 16:24:53 檢舉
門神大這個太硬了(雖然我現在也是在SI廠商)
XD
kawa0710 iT邦研究生 5 級 ‧ 2024-09-12 08:34:44 檢舉
我建議...先問主管有多少經費做備援...
我的客戶不管提多少需求, 只要我問了這個問題後續他們不會再問了.
感謝各位大大的建議.都給他筆記起來.話說原本只有做資訊相關維運工作.以前公司比較有規模會有簽約廠商可以詢問或補救也有SOP去做,目前這間來了快一年要說大也不大(50人左右),過去3,4年前並沒有資訊人員,主管是寫程式抓過來當資訊人員實際也不大了解有的資料他都會提供參考但都很舊4,5年或更久公司又搬過家,所以從自己盤點,各伺服器實體擺放,裝了什麼硬體,線路知道的都自己生出來(1,2,4,5自己生)從各自主機是做什麼,實機硬體規格容量,裡放多少虛機,IP和備份到各自NAS大概都有記了下來.還有帳密,也都一個一個試更新記錄,然後很多從沒更新的作業系統要做windows update更新就更新..這些盤點,調查,記下各自負責做的東西花了快一年這樣..其他還要做很多MIS的工作(user端,電腦10年以上沒在更換,天天有問題),目前USER端已更新汰換中,無止盡的更換,機房端的還沒做汰換或更新設備,只能維護,遇到有問題就快點找辦法解決。不過還有很多要學和努力,感謝大家幫助^^
50人真的只是小公司,建議把所有事物理清楚,把該學的學一學,之後去幾百人,幾千人甚至幾萬人的公司才能游刃有餘,不然,時間過得很快,一晃眼幾十年就過去了
好的.謝謝你我會加油
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中
0
kobecho
iT邦新手 3 級 ‧ 2024-09-11 15:55:05

針對你的問題 感覺你是第一次接觸機房網路及伺服器管理的感覺,建議你利用下班時間進修或是請主管找SI廠商協助維護你也順便在旁學習一些基礎管理即故障排除,還有管理機房第一個要有危機意識做好如發生問題的處理方式及解決方法,不能靠主管來下指示才動作這樣你的工作KPI已在主管心中大打折扣了

好的了解感謝大大的建議.筆記!!

0
vit5015
iT邦新手 2 級 ‧ 2024-09-11 16:05:56

1.主機狀況盤點還是得自己親手去做,但能請廠商一起介入,不懂的就問廠商到懂.
2.故障還原跟備份備援看要做到甚麼程度(資料中斷量,整機還原時間能接受多久),再請廠商推薦相對應方案,導入方案的同時你也能學會怎麼做.後續固定時間演練還原,熟悉後就不會這麼緊張.
3.備品看是要機房備用或著考慮簽維護合約.
4.硬體效能改善,評估設備使用年限與更換價格看是要增購配件還是換新.
以上這些SI廠商應都能協助,你已經盤點完問題,可以看你所在地區,直接找廠商洽談.
跨出第一步比較困難,實際去用會發現大部分問題,你自己找網路上都有解答.但建議還是要找個廠商簽維護,有困難能即時問,真的出事也不會自己一個人慌張..

好的感謝大大的建議
1.主機盤點硬體、軟體、IP、設備各自做什麼大概剛來的時候都點做看過記錄一遍了.以方便日後找相關SI廠商洽詢
2.這1塊就真的沒有演練和不熟,因為遇到那一個虛機故意或壞,大概就是VM虛機整個倒回,再看壞的時間要不要在增加導回資料庫但這塊就是只能遇到實際在做,之前並無遇到整個掛掉的狀況,所以會害怕不熟不過經過這次有好一點也記錄下來SOP。
3.買備品是一定要的吧,尚在考量找廠商還不知找什麼SI,不過簽維護感覺公司會都會有種想法已請資訊人員了自己想辦法還簽維護幹嘛,所以感覺會被打槍。
4.硬體評估改善這是接下來要做,明年才有預算進行。

vit5015 iT邦新手 2 級 ‧ 2024-09-13 13:21:13 檢舉

3.如果公司這樣想,那資訊人員壓力會很大.就算該系統9成以上的問題資訊人員都能解決,只要出現不能解決的問題,資訊人員就得扛責. 有要久任得慢慢導正公司對資訊人員的認知,有廠商維護對公司才有相對應的保障.
這部分也難強求,真的沒廠商就當練功吧,先假設全部系統故障,你能從無到有還原回來吧.

3
PIZZ
iT邦新手 2 級 ‧ 2024-09-11 16:07:36

首先你要去和你主管要:
1.網路圖
2.設備表
3.架構圖
4.公司SOP
5.部門內部操作手冊

然後去看他、讀他、弄熟他、"弄懂他",通常這些東西不一定會一直持續有更新,所以可以和現況做比對,去盤點每一個項目(實體/虛擬)

找不到或沒有的就想辦法去問,去弄懂那些在和不在清單上的東西

然後遇到問題要先動腦,YT、Google、GhatGPT都是你的好幫手,要會去搜尋關鍵字和釐清問題,並判斷哪個回答是正確的,然後不要一直糾結在哪個才是最正確的答案/方案,先動手做,然後邊做邊想邊修正出最快最好的方式,你就會得到一套屬於你的經驗和作業流程(<<<這部分每個人的方式都不一樣)

再看你們有沒有配合的SI(不管是買設備、維護...等等的),有沒有相關培訓課程能上(內訓/外訓),沒有的話你也可以自己主動和主管提出申請受訓,或是請主管安排時間或指派人員幫你做一次內部的教育訓練!

大概是這樣...

看更多先前的回應...收起先前的回應...

感謝大大的建議,1~5目前都是自己做,有遇到或可以盤點和了解的都會把自己做的資料隨時更新,以前這裡4年沒資訊人員..主管也沒什麼給你請自己做大概都這樣..XD

PIZZ iT邦新手 2 級 ‧ 2024-09-12 10:19:22 檢舉

這樣有好有壞,好的就是你那邊現在就是個練功場,你搞懂了,大部分地方都大同小異,只是設備多少/品牌和用的軟體不同的差別

壞的,就是不很好做

至於3~6項,既然你都是自己做,而且老闆看似也同意汰舊換新,那就看是使用現有資源還是先做計劃+預算提交上去,然後找SI一起協助規畫,進行整改了!

WOWO大大果然很精僻見解,謝謝,對是個練功房只是以前用的軟硬體設備不同,例如以前的環境都是用實機1種1個server(mail,資料庫,防火牆,人資,財務...都1種1實機),現在是1個虛擬平台實機.然後可以做很多虛機系統工作.然後各種備份串連NAS,每日備份等等..是比較方便和維護,好處哪一個壞就去修那一個虛機..不過現擔心的是1個實體平台伺服器壞那就要有備援或災難計劃去做,公司沒有做HA也沒備援.所以可以想想這一塊,而且公司的伺服器都買中古機也沒SI維護,當然計劃+預算提供找SI來協助規劃.公司會想改善..不過找了1,2個SI.感覺都是獅子大開口然後叫你弄一堆有的沒得..感覺很討厭,所以要再找合適的不過比較要花時間找了。

PIZZ iT邦新手 2 級 ‧ 2024-09-12 11:00:00 檢舉

一個服務用一台實體機,這大概是約莫1X~20年前的做法了吧...!!

現在設置一座/一台虛擬機/ESXI/VSAN/超融合的方式算比較常見了

至於備份備援的部分,你可以去研究下VEEAM社區版,然後裝在另一台實體機上(WIN10/11的PC也可以),用這個去備份(打包)你家的虛擬機,然後復原的部分就看你拿時後能拿到硬體設備,直接用VEEAM去復原

這大概是目前最省錢的做法了...不然沒HA也要多一台主機去做叢集會比較好些,至少一台實體掛掉還能夠把虛擬機搬移到另一台上恢復服務

至於虛擬機設定的部分,記得ESXI好像不提供免費版了...你可以找下VMware workstation 17 pro(免費)來玩玩,基本概念和ESXI大致相同

HyperV的話,Windows pro記得有內建...

而依照你的環境,SI來規劃通常一開始也都會叫你整個更新,畢竟什麼線重拉啦,網路重規畫啦,主機重弄啦,對他們來說比一個個清查盤點查線要簡單

不過分階段作業/更新也是可以和SI討論的,但是要找到好的SI也滿重要的!(但這又牽涉到你們的規畫和預算...)

0
s0919112
iT邦新手 5 級 ‧ 2024-09-12 04:31:58

兩天內針對你所有問題編寫一個完整的AI系統監測專門解決你目前的問題.......收費五千內...測試後完全滿意再付費.有意建請留言.....根據您描述的情況,似乎您面臨了一些與伺服器、網路和虛擬機管理相關的挑戰。以下是一些建議,幫助您改善現有的系統和處理能力:

  1. 伺服器佈建情況
    文檔化基礎架構:建立完整的伺服器配置文件,包括硬體規格、操作系統、安裝的應用程式及其版本。
    建立網路拓撲圖:用圖示的方式展示伺服器和虛擬機的關係,方便未來的維護和問題排查。
  2. 主機、VM、各台配置狀況
    定期檢查:使用監控工具(如Nagios、Zabbix等)來持續監控各伺服器和虛擬機的性能與狀態。
    資源分配優化:確保每台虛擬機的資源配置符合其實際需求,避免資源浪費或不足。
  3. 故障的危機處理
    建立應急計畫:針對常見故障制定應急計畫,包括步驟、負責人及其聯絡方式。
    演練故障恢復:定期進行故障恢復演練,確保團隊熟悉流程,能快速反應。
  4. 備援和備份的狀況
    定期備份:建立自動備份機制,確保虛擬機和數據庫的數據定期備份。
    測試備份恢復:定期測試備份的恢復過程,確認備份數據的完整性和可用性。
  5. 網卡的備用
    配置冗餘:考慮配置網路冗餘(如NIC Teaming),當一張網卡故障時,另一張能自動接管。
    定期檢查硬體狀態:定期檢查網卡和相關硬體的狀態,及早發現潛在問題。

大神太利害,這感覺是一個SI或專家會協助做的目前還沒有找到希望能找到一個合適可以問的,很多都嘛不會給你問那麼多.^^

0
打雜工
iT邦研究生 1 級 ‧ 2024-09-12 08:57:40

不知道您來該公司多久了,發生的事件是屬於你的業務範圍嗎?
如果來公司很久了,又是屬於你的工作責任範圍,那我只能說你該打屁股了(因無危機意識)
如果上述問題皆否,那你自然有託辭,就趁這段時間趕緊學習吧...
如何學習,如其他大大所說,自己建立一套相同的環境,過程中一定會遭遇問題
解決問題的過程中自然會學到很多經驗,能建立起相同的環境後
就可以開始模擬各種災害狀況,並將其解決或修復
之後你就不用擔心類似狀況了

好的了解來幾個月了..資訊都是我的業務範圍所以必需自己找方法和去建立一個可以解決和還原的機制以備不時之需

我要發表回答

立即登入回答