iT邦幫忙

DAY 18
6

30天搞懂TSM備份這檔事!系列 第 14

30天搞懂TSM備份這檔事_18(磁帶異常& TSM)

雨天、城市、上班族

如果是環境造成,那就去調整環境,這問題不大。如果是自然毀壞,那磁帶壞了也就是壞了...注意哦,我指的是磁帶壞了哦!唯一要非常注意的就是人為。這是操作習慣的問題,比較難用TSM指令修復。
『在磁帶櫃是Multi-Path的情況下,有用SAN備份的AIX主機,在 AIX的作業系統裏,要調整一個設定,不然就會有一堆磁帶每天變成Unavailable。』

「是哦!?」

『還記得這張圖吧,在Multi-Path的情況下,兩個實體的磁帶機,作業系統可能會認到四個。是吧!?』

「是!」

『除了磁帶機會認到四個之外,還有一個非常重要的東西,也會...』

「...什麼?」

『Tape Medium Changer...又稱為Robot或Control...我們的慣用語是機械手臂。』

on哥這下可真不懂了...「能解釋一下嗎?」

『嗯...之前提過,磁帶平常在磁帶櫃的Slot裏,是吧? 要使用的時候,才會被Mount 到 讀寫頭那邊,記得嗎?』

「是啊...」

『是啊...那磁帶要怎麼到讀寫頭? 用悠遊卡嗎?』

on哥心中的怒火,又燒了起來...「我懂了,你的意思是,機械手臂會抓磁帶到讀寫頭。」

『對啊對啊!』

「然後,在Multi Path的情況下,一個手臂會被認到兩次...」

『沒錯! 所以,我們要設定,那一個是主要的,機械手臂在AIX裏面是smc,請你要記得這個指令。這個PDF檔裏面有範例,另外這也是AIX系統的內建指令。』

chdev -l smc(編號) -a alt_pathing=yes

『這個指令是在AIX作業系統裏宣告,要以那一個Control為Primary(主要),這樣TSM在使用磁帶備份時,就不會因為沒有這個設定,造成磁帶大量Unavailable。』

「哦,問你哦,為什麼你要離職啊!?」

太陽的雙手停了下來,整個人突然變的呆滯,他深深的吸了一口氣,接著深情的看著on哥『想知道答案? 那等我離職那一天,我再告訴你,現在我們繼續看TSM,所以剛才介紹的那個指令,非常重要! 接下來,我們來看磁帶異常時的處理吧!』

太陽邊說邊翻了筆記。

『正常情況下,如果磁帶變成ReadOnlyUnavailable,只要用 update volume 磁帶編號 access=readw,就可將磁帶狀態改回來。』

「那我要怎樣知道,目前磁帶的狀態或是有沒有磁帶變為異常?」

『那你要使用query libvolume access=readonly或者query libvolume access=unavailable,這個指令去查詢。』

「了解...我再想一下,有什麼問題哦...」

『你慢慢想,我出去吹吹風...』

太陽又消失在辦公室裏了,太陽不在on哥想當然...就放風...就開始思考關於TSM才是。他一邊看著太陽的筆記本,一邊看著電腦螢幕裏的一篇部落格,那是太陽的部落格!

on哥是個奇人,竟然能一邊回Line時,一邊看著太陽的筆記本和部落格,這類的人,都有成為專業系統整合工程師的潛力,因為系統整合工程師,做到最後,都是用切割時間的方式,去完成一堆阿里不答的事情。

「哇...這是太陽寫的哦,什麼東西啊! 他那外表和個性,寫的出這樣的東西哦!? 太扯了吧!」on哥邊看,心裏邊這樣想著。

**過往的鮮明 並非過去 還照耀著自己
也不是心底陰影 讓當下染上灰意

而是旅途中 受了傷
那紅 帶走了相信
那透明 種出了回憶
那人生 開始可期

現在的喜悅 並非滿足 也不是可以
心底沒有遲疑 只是一步一步踩著大地

那微笑 趕走了情緒
那透明 化為彩虹
偷偷呢喃
我倆 幸福的足跡**

『咳咳...咳,有什麼要問的嗎?』

「啊!? 你回來啦! 哦...有啊,我要問......問...對了! 如果磁帶不是你剛才說的那個狀況,變成Unavailable,而是正常的情況,變成Unavailable的話,要怎麼處理?」

『正常的情況...我想想...一般來說磁帶變成Unavailable有三種可能,環境、人為、自然,像這一頁寫的。』

『如果是環境造成,那就去調整環境,這問題不大。如果是自然毀壞,那磁帶壞了也就是壞了...注意哦,我指的是磁帶壞了哦! 。唯一要非常注意的就是人為。這是操作習慣的問題,比較難用TSM指令修復。』

「噗,你真的很能扯,人為的操作,怎麼可能用TSM指令修復...」

『是啊,就好像你的Line一直響,我都沒辦法輸入halt,像關掉TSM Server 服務一樣,把你的Line關掉。』

「............」

『來看這一頁吧。

Unavailable的磁帶,如果裏面的資料是不需要救回的,或是裏面沒有資料的磁帶,直接重新做label libvolume就好了。』

「了解,我很好奇,你為什麼會知道剛剛你說的那個chdev的指令?」

『不只你好奇,我也好奇、顧問B也好奇、PM也好奇、我們主管也好奇...』

「這...」

『為了那個指令,PM還發Mail問我為什麼我要設定那個指令......』

「哦,為什麼?」

『PM的同事...是這邊的硬體工程師,AIX的工程師...你懂吧?

因為一直有磁帶變成Unavailable,顧問B只要一講到這件事,就會先說因為我沒有能力,所以他必需來幫我處理。

然後,好不容易等到他跟我去機房裏檢查,第一次進去不到三分鐘,就叫我找硬體工程師,說那是硬體工程師負責的,不關他的事,然後人就走了...。第二次,五分鐘。第三次稍微久一點,但最後叫我打他們的0800電話回報...

找硬體工程師,硬體工程師跟我說「磁帶櫃是好的」,的確也是好的。打0800電話...我自己就能打了,需要花那麼多錢請一位顧問B來告訴我嗎?

PM跟我們老闆說,要請顧問,因為這樣遇到問題時,處理才會快......

最後,業主的系統都正式上線了,大量磁帶變成Unavailable這件事,一直被推來推去。

我查了TSM和AIX都沒找到類似的問題,最後想到應該去查磁帶櫃的文件,碰碰運氣,沒想到一查就找到了,找到後我自己跟硬體工程師確認,硬體工程師問我「顧問B不是這個專案裏的TSM顧問嗎? 為什麼他不知道?」 我心想,那是你同事,又不是我同事,我怎會知道TSM顧問,不知道要做這樣的設定......』

「結果呢?」

『結果就是,PM叫我寫Mail說明為什麼要用這個指令...可是,那文件也是PM公司在全球網站公開可下載的技術手冊,為什麼要我寫Mail說明......』

on哥聽的目瞪口呆,他心想「如果是我遇到這個狀況,我應該會瘋掉...」

『所以,你把這文件下載下來,裝到你的電腦裏,以後有人問你這個問題,你就把網址給對方,請他自己下載下來看...網址在這 IBM Tape Device Drivers,自己下載,不要想從我這複製,了嗎?』

「嗯...了,我了...感覺你比較像......」

太陽看了看on哥,用眼神阻止他繼續講下去。

『我領老闆薪水,是來做事並且把事情做好,不是來這跟那些魑魅魍魎喊芭樂拳還有欺騙業主的。更不是為了要在這個專案裏,跟別人套關係,方便自己有機會換到大公司任職,了嗎? 我們喝點水,再繼續Unavailable吧。』

(待)

2013/10/10 SunAllen

下回預告:

TSM的Unavailable磁帶,處理起來真的頗複雜,看看太陽跟on哥要怎麼一起Unavailable吧。

鐵人賽_MIS技術組_文章導覽
上一篇
上一篇

2013鐵人賽_文章總覽
個人全系列連結


上一篇
30天搞懂TSM備份這檔事_17(磁帶異常& TSM)
下一篇
30天搞懂TSM備份這檔事_19(磁帶異常& TSM)
系列文
30天搞懂TSM備份這檔事!26
0
0
lihamer1
iT邦新手 3 級 ‧ 2014-05-30 10:45:51

哈哈哈,看到那一段B顧問在找問題的故事,不覺莞爾。
因為現在公司的專案也是與 I Believe Money公司合作,最近跟他們的工程師或PM打過幾次交道之後,真如on哥心裡想的,「如果是我遇到這個狀況,我應該會瘋掉...」
不同的是,現在我已經ㄍㄧㄠv甲無力了。。。原廠?唉。。。
再這樣下去,這個I牌台灣工程師真的會被阿陸仔全部取代!!

我要留言

立即登入留言