今天來到了鐵人賽的第十天,都快過了 1/3 結果一行程式碼都還沒寫到,別急別急,等今天安裝完一些工具之後,就可以開始動動手寫 code 了。
在正式安裝工具之前,這裡還是花一小段時間回顧一下我前面在做什麼
這天談到了三個現今耳熟能詳的三個關鍵字:人工智慧、機器學習、深度學習之間的關係。人工智慧是人類一直夢寐以求要達到的目標,機器學習是幫助人類實現人工智慧的方式之一,深度學習是機器學習中處理問題與學習的一種方式。
所以到底機器要怎麼學習?有七個主要的步驟如下:
這裡話鋒一轉,突然講到了迴歸分析,那是因為在過去人們就靠著迴歸分析的方法,來對已經收集到的資料建立模型,來預測未來可能發生的事情,而這也是現今機器學習在做的事情。機器到底在學什麼?機器在學著如何像人類一樣做出判斷,人類依據經驗或是邏輯推理做出判斷,而機器會依據模型來做判斷。
在阿鐵的例子當中(如果你還記得的話),他要解決的問題是,預測新車油耗與里程數之間的關係(多少油可以跑多遠),那麼要怎麼做呢?
首先,他先在論壇上收集了一些資料(收集資料、準備數據),接著他選擇了最簡單的線性模型(選擇模型)來做回歸分析,過程中他知道要找到最準的線,就是要找到 Loss Function 最小的地方。
Loss Function 最小的地方 要怎麼找呢?這時候我們介紹了梯度下降法的實作概念(訓練機器)。但梯度下降法也不是什麼萬靈丹,還是有些可能會產生問題的地方,這時候機器再厲害可能都沒有用,就需要人的經驗、不斷的實驗來不斷優化模型。
講到這裡,其實我們就大概跑過了機器學習的前四個步驟,這當然是極度簡化的版本,希望看官們看到這裡,對於機器學習有個非常基本的了解。
### 回到正題,我們來安裝 Anaconda 吧
[Anaconda](https://www.anaconda.com/) 是一個開源、免費、可以在不同作業系統上執行的工具。Anaconda 是個大補帖(或者你可以說是懶人包),除了 Python 之外,還有許多跟資料科學、機器學習的第三方套件可以使用,可以說是非常方便,一站搞定。
#### 下載 Anaconda
你可以到[這裡](https://www.anaconda.com/distribution/)根據你的作業系統,下載對應的 Anaconda 檔案(我用的是 macOS 版本)

其實安裝過程非常簡單,不需要做任何的設定,就讓它一路到底

#### 啟動 Anaconda 並執行 Jupyter
安裝好之後,就可以啟動 Anaconda。這時候桌面會出現一個綠色的環。

啟動之後來到到了 Anaconde 的介面,你會發現上面有不少的工具可以使用

接下來,我們要使用的是 **Jupyter Notebook**。Jupyter 是一個很像 editor 也很像 IDE 的東西,也就是我們可以在上面寫 python 的程式碼,同時也可以直接在上面逐行執行程式碼並看到結果。不如就讓我們直接來看看吧。
點擊 Jupyter Notebook 下方的 Launch 按鈕,這時候會啟動 Jupyter 並跳出一個瀏覽器頁面。

#### "Hello world" on Jupyter
點擊右上角的 New 然後選擇 Python 3,就可以打開一個新的檔案。在這個檔案裡,中間主要的區塊就是讓我們寫程式碼的地方。讓我們在第一區塊 (cell) 寫下
`print ("Hello world")`

之後,按下上面的 Run 按鈕,Jupyter 就會開始執行你目前所在位置的區塊的程式碼,並立即看到結果。你會看到原本程式碼的下方,出現了 Hello world 的字

當然之後我們會持續地寫入我們需要的程式碼,然後透過逐行執行的功能,來幫助我們確認程式碼的 output 以及 debug

最後,別忘記存檔。在 Jupyter 上編輯儲存的檔案類型是 .ipynb

就這樣,我們已經可以開始在這裡寫 Python,未來將可以在這裡運用更多的 Python 套件來做機器學習。工具設定好了,明天來寫點程式碼暖暖身吧!