iT邦幫忙

2017 iT 邦幫忙鐵人賽
DAY 1
2
Big Data

R 語言使用者的 Python 學習筆記系列 第 1

[第 01 天] 建立開發環境與計算機應用

從事資料科學相關工作的人,免不了在起步時都會思索:「假如時間有限,我應該選擇學習 R 語言或者 Python?」網路上相關的討論串已經太多,既然前提是「時間有限」,那我們更不應該花費時間去閱讀這些討論串,閱讀下來對於程式語言鄙視鏈的收穫可能還比原本的題目來得大。

這系列文章的視角是一個 R 語言使用者去學習 Python 資料科學的應用,希望讓還沒有開始學習的人對這兩個程式語言有一點 prior knowledge,藉由閱讀這系列文章,跟她們都稍微相處一下看看氛圍如何,再決定要選哪一個作為切入資料科學應用的程式語言。

學習筆記的脈絡

這份學習筆記從一個 R 語言使用者學習 Python 在資料科學的應用,並且相互對照的角度出發,整份學習筆記可以分為五大主題:

基礎

基礎應用

視覺化

機器學習

深度學習

建立開發環境

R 語言的使用者可以在 CRAN 下載 R,然後再去 RStudio 下載這個好用的 IDE,兩者安裝完畢後就建立好了 R 語言的開發環境。

那麼關於 Python 的開發環境呢?我使用的作業系統是 OS X,系統已經安裝好 Python,只要打開終端機(不曉得怎麼開啟終端機的 Mac 使用者只要按 Command + Space 打開 Spotlight Search,搜尋 Terminal 然後按 Enter)輸入 $ python 就可以開始使用,如果需要編寫 .py 檔再執行的話我也可以使用慣用的 Sublime Text 或者任意的文字編輯器,感覺好像不需要再額外準備什麼東西。但是跟 RStudio 相較之下這樣的開發環境是略顯單薄了些,我覺得最基本起碼要能夠讓撰寫 .py 的編輯區跟命令列並陳,這樣開發起來才會舒服。

為了不要在第一天就歪腰,經過短暫的 google 之後,我打算使用 Jupyter Notebook 來作為我的 Python 開發環境。

安裝 Anaconda

Jupyter 官網的安裝建議沒有經驗的 Python 使用者透過 Anaconda 來安裝。Anaconda 是森蚺,南美洲的無毒蛇,跟蟒蛇(Python)都是體型非常巨大的蛇類,私心相當喜歡這個命名。

前往 Anaconda 將 .pkg 檔下載回來進行安裝。
OS X 原本安裝好的 Python 版本是 2.7,Jupyter 官網推薦安裝 Python 3 以上的版本,所以我選擇了 Python 3.5 版本的 Anaconda 4.2.0,安裝。Anaconda 安裝完畢後,在終端機輸入 $ python 確認安裝完成。

Python 3.5.2 |Anaconda 4.2.0 (x86_64)

輸入 Ctrl + D 離開 Python。

啟動 Jupyter Notebook

安裝 Anaconda 的同時也已經安裝 Jupyter Notebook,接著在終端機輸入以下指令啟動 Jupyter Notebook。

$ jupyter notebook

我們可以清楚得看到 Jupyter Notebook 是在 localhost:8888 上面運行,但是當我想要新增一個 Notebook 的時候,它出現的是 python [conda root] 與 python [default]。

day0101

修正 Kernel 顯示問題

回到終端機按 Ctrl + C 停止 Jupyter Notebook,接著在終端機輸入指令。

$ conda remove _nb_ext_conf

重新啟動 Jupyter Notebook,在終端機輸入指令。

$ jupyter notebook

新增一個 Python 3 Notebook,問題順利排解。

day0102

開發環境已經建立妥當了,接著讓我們在上面做最簡單的計算機應用吧!

計算機應用

在剛剛新增的 Python 3 Notebook 的第一個 cell 輸入一些簡單的加減乘除。

print(2 + 3)
print(2 - 3)
print(2 * 3)
print(10 / 2)
print(3 ** 2) # R 語言使用 3 ^ 2
print(10 % 4) # R 語言使用 10 %% 4

輸入完後,選擇這個 cell 並在上方的工具列點選「Cell」後點選「Run Cells」,就會得到答案輸出。

day0103

day0105

跟 R 語言的運算子略有出入的地方在指數與餘數計算的部分。Python 使用 ** 而非 ^ 來計算指數,使用 % 而非 %% 作餘數的計算。

小結

第一天我們介紹了怎麼在自己的電腦建立 Python 的開發環境,在上面做了簡單的計算機應用。在建立開發環境與計算機應用時也跟 R 語言比較了一下。

參考連結

同步刊登於 Github:https://github.com/yaojenkuo/learn_python_for_a_r_user


下一篇
[第 02 天] 基本變數類型
系列文
R 語言使用者的 Python 學習筆記30

1 則留言

1
丹尼斯
iT邦新手 5 級 ‧ 2017-02-27 23:54:54

嗨您好,請問“出現的是 python [conda root] 與 python [default]。”和“新增一個 Python 3 Notebook,問題順利排解。”部分,前者和後者的差異是什麼呢?

tonykuoyj iT邦新手 5 級 ‧ 2017-02-28 12:24:31 檢舉

Hi,
Anaconda 可以支援多個版本的 Python 環境,在原本的問題中它無法辨別我們要使用的 Python 3 環境;如果沒有排解問題,會因沒有設定好對應的環境而導致沒有回應(第三個參考連結就是討論這個問題)。
但是這個問題在新的 Anaconda 4.3.0 使用 Python 3.6 已經被修正,不再需要進行問題排解。

Best,
Tony

我要留言

立即登入留言