前面幾堂課都是很基礎的科目, 也大多是在大學部都會開的必修或必選修的課, 接下來就不是單純的大學部簡單的課了.
首先開始的就是效能調校, 這原因應該沒有甚麼人懷疑吧, 因為這邊說的 Data Engineer/Data Scientist 要處理的多是 Big Data, 就之前所提到的, 不可能所有的計算式 Big O 是在 n log n 以下, 或者說甚至是 NP-Hard, 因此算個幾千億次處理億萬筆資料跟本不為過, 要做這樣的計算與處理就是稱為 "High Performance Computing", 要做到這樣, 最重要的就是 "效能調校/Performance Tuning".
只是這系統調校是有很多層面的:
這邊的每一層所須要的知識都不太一樣, 而前面講到的計算機組織, 作業系統, 資料庫都是為了這時所須要來紮下基礎, 接下來就是很多實作等著我們去挑戰了.
系統調校的步驟如下:
其中最要的是幾個點:
用到的技巧包含:
而目標方法有
只是就如前面所說的, 校能調校每一個層面都不一樣, 後面還是會講到不同層級的效能調校, 所以這也只是個基礎而已.
電子書:
關鍵字: