如果一個大型的系統建置專案,從開始到結束預估是三年,那麼三個小時的打烊班,就是一個非常小型的專案。
需要想像力要幹嘛? 有用嗎? 「需要想像力」的重點是做事的過程,而不是結果。有些事情要的只是結果,但也有許多事,需要的是過程。這不是繞口令,這是在這個產業中,讓我們在工作時,能順利的要素之一。
兩年前,我到我家附近的麥當勞做打烊班,對一個30沒有好幾的人來說,做打烊班是一件很不容的易的事情。第一個不容易是「節奏」。如果一個大型的系統建置專案,從開始到結束預估是三年,那麼三個小時的打烊班,就是一個非常小型的專案。在大型系統專案中,只要MileStone還沒到,就會常常聽到「今天做不完,明天做啊!」
但在麥當勞可就不行了。如果跟客戶說「我的地板今天還沒拖乾淨,明天再拖,或是我煎肉餅的爐子還沒清好,明天再清。」到了明天,來的可能就是新聞SNG車、消保官和衛生稽查員。
所以光是「節奏」要跟的上,在剛開始的時候,就非常不容易。
第二個不容易是,沒有太多的「學習」時間和機會。第一天,別人做,我看。第二天,我做別人看。第三天...我自己一個人做。因為有和當時的主管反應,我學的速度有點慢,可能需要有人多看著我幾天。一直到上班後的第二個星期,才開始獨立作業。這中間,有件事,幫了我很大的忙,就是「想像力」。
打烊班開始的第四天下班後,約零晨兩點,我告訴值班經理,我想做筆記,希望能讓我回到後場,值班經理同意了。接著我走到旁邊的7-11買了筆記本,再回到店裡。
就是永和得和路的這家店
大概花了一個半小時,請教大夜班的人,他們在說的那些「專有名詞」是什麼,接著畫出了這張紙。
隔天早上,我又用了一個半小時,努力的回想,打烊班所有的工作項目,並寫在這張紙上。
然後,兩張紙一起對著看,想像自己站在後場,從開始上班的那個當下,我要做什麼事、要怎麼做、要和誰確認...等等的工作細節。接著,等到上班時,把我做的小抄帶在身上,做到某個點遇到問題了,就偷看一下小抄。從有空的情境模疑、看小抄、到不用小抄,就能夠講出所有工作項目和順序,我大概花了兩個星期。大概三個月之後,已經非常上手,並且快速和正確。
這些跟系統整合或工作有什麼關係? 當然有關係。
「情境模擬演練」這件事,是非常多產業都在做的。『寶傑...我跟你說...系統工程師到客戶那邊,就只有兩件事,一、處理系統有關的事情。二、處理客戶的事情。』
舉兩個系統方面的例子(非系統原生bug):
案例一:
辦公室裡有PC_A和PC_B,這兩台PC在兩個不同IP網段,中間會經過兩個防火牆,兩台PC都有防毒軟體。
同樣傳送十G的資料時,PC_A 到 PC_B 很慢、PC_B 到 PC_A 很快,原因不確定...
請問:安裝這兩台PC的工程師,遇到了這樣的狀況,該檢查什麼地方或提出什麼問題。
案例二:
機房裡有300台主機,某一天早上,其中的100台主機,無法將需要的檔案,備份到File Server上面。檔案傳輸是透過TCP/IP V4的網路環境。
請問:現在有這樣的狀況,該檢查什麼地方或提出什麼問題。
這兩個實際案例,都是在只知道這些資訊的情況下,只能慢慢的將原因找出來。But, If, 到了現場,看到狀況,就直接說出是什麼什麼...那就只是亂槍打鳥。
沒有錯,老闆和主管都只想知道我們有沒有把「問題」解決掉,如果答案是「沒有」可能會說「能力不夠、經驗不足或只問一句_何時能處理好」。的確,這些都是在現場的壓力來源之一。就算有壓力,也還是要「先想一下」和「再做下一步」。
最近這一年,工作時,別人問我最多的一句話就是「為什麼失敗...」
我回答別人最多的話,則是『讓我查一下,確認原因,再回答您。』
過去遇到很多狀況,包括自己...都是用亂槍打鳥,在處理問題。但那不是機器設備上,有放乖乖就沒事的。沒有先想過的處理方式,讓後果更嚴重的案例,每天都在發生。
現在機房內的設備,已經不太像以前一樣,設備單純。以前可能就只有Server、防火牆、Switch和Router。「個資法」讓機房裡面多了一些「設備」,這些「設備」在「資安的考量下」,讓系統環境和問題變的更複雜。
另外一個會需要面對的,就是「客戶的問題」。
客戶的問題,需要好好回應的。就算我們讓機器設備運作都正常,客戶也不一定會對我們滿意。特別是在,我們比客戶,還不了解他們的環境或是我們要處理的系統\設備時,對於他們提出的問題,又回答不出來,或是自己也不知道在說什麼的情況下,這只會讓我們的陷入更大的困境裡。
之前舉個幾個例子,給我同事聽。
我申請了ADSL,來安裝小烏龜的先生,到了我們家裡之後,告訴我「小烏龜要裝在廁所...」
我一定請他離開。
我去裝汽車雨刷,師父告訴我,雨刷要裝在汽車裡面,我應該也是馬上將車開走。『寶傑,我告訴你,這...太...扯...了。』
聽起來很好笑,我同事聽了後,也哈哈大笑。可是,我們的確也會因為對自己公司的產品或對客戶環境不熟,而對客戶說出類似的話...只是...客戶一定笑不出來。
這些例子,都只是在說,要花時間「想」,客戶可能會問什麼問題、對方關心的是什麼、對方的環境是什麼、如果出了狀況,要怎麼尋著「資料流」做檢查。「資料流」就是「網路封包」,只是習慣稱為「資料流」。
OSI有七層、TCP/IP有四層,如果遇到的問題跟網路有關,是斷在那裡? 有什麼能讓網路中斷?
一個服務無法起動,如果不是服務的檔案本身有問題或bug,那為什麼昨天可以起動或剛剛可以起動?
這些,都需要在平時,了解環境、產品和相關的設定,才能有東西可以想像,不然就會變成空無一物的華麗。
(待)
2012/10/04 太陽哲齡
更多文章都在行雲流水IT人
出題目小考
看看你們除了搶沙發之外
還有什麼本事
會的同學請舉手
舉手...我會!
不過我只有兩題不會, 第一題不會, 第二題也不會
吼,不僅沒搶到沙發,竟然連海綿寶寶都比我先....
會拉賽~蓋歪樓虧妹妹
出題目小考
下一集會有解答嗎??...
sunallen提到:
就是永和得和路的這家店
這邊有大師幫你解答~~~
你需要先點餐才能得到解答
今天晚上去這邊吃晚餐吧~~~
案例一:
辦公室裡有PC_A和PC_B,這兩台PC在兩個不同IP網段,中間會經過兩個防火牆,兩台PC都有防毒軟體。
同樣傳送十G的資料時,PC_A 到 PC_B 很慢、PC_B 到 PC_A 很快,原因不確定...
請問:安裝這兩台PC的工程師,遇到了這樣的狀況,該檢查什麼地方或提出什麼問題。
推測有三
一、防火牆(軟體或硬體防火牆都有可能)
二、防毒軟體
三、系統OS(最近遇到的....最後發現是系統重灌就好...原因不明,超過一定GB就無法直接PC TO PC拉)
不過這案例的網路架構中,是否存在switch?它也會影響到呢…
案例二:
機房裡有300台主機,某一天早上,其中的100台主機,無法將需要的檔案,備份到File Server上面。檔案傳輸是透過TCP/IP V4的網路環境。
一、軟體防火牆
二、路由(路由錯誤之類的…)
三、權限異常....
四、Switch問題
我想得到就這樣…不知對不對…
switch+1
網路線斷了+1
案例一:
可能是防火強作祟,PC_A到PC_B檢查的東西太多,或者限速了,PC_B到PC_A檢查的東西可能比較少,或者沒限速。
案例二:
應該會先檢查網路是否有通。能不能PING到那台File Server。
再來檢查需要備份的檔案存不存在,對方的路徑存不存在。
再來就是備份軟體是不是正常運作~
以前我應該會這樣檢查吧……不知道有沒有中
同樣傳送十G的資料時,PC_A 到 PC_B 很慢、PC_B 到 PC_A 很快,原因不確定...
路線都一樣,怎麼可能是當中的Switch HUB出問題?機會太低
我會從硬碟存取、作業系統問題這邊著手
案例二:
機房裡有300台主機,某一天早上,其中的100台主機,無法將需要的檔案,備份到File Server上面。檔案傳輸是透過TCP/IP V4的網路環境。
1.先從這100台的網路路線著手檢查-->備份到File Server
2.這100台可否互丟、File Server可否被其他來源丟(傳送、接收之間,路徑、設備等)
我不相信網路協定出錯,這機會太低了