昨天提到了 Python,那就不能不介紹資料科學中相當重要、可以說是 Python 懶人包的 Anaconda(https://www.anaconda.com/),除了把 Python 本身整理完成外,還打包了 Python 常用的資料分析、機器學習、視覺化的套件。只要在同一個版本的版次下,處理分析結果是相同的,故可以在不同的平台與環境上彼此使用。Anaconda 內含的重要套件包含:
Numpy ➫ Python 做多維陣列(矩陣)運算時的必備套件
Pandas ➫ 讓 Python 有超越 Excel 作業的功能
Matplotlib ➫ Python 的基本視覺化工具,能畫出主要模式的圖表
Seaborn ➫ 知名的視覺化工具套件,類似 Matplotlib
Scikit-Learn ➫ Python 機器學習工具主要的部分
Notebook (Jupyter notebook) ➫ Python 的開發工具
利用現有整理好的工具,寫程式的成分稍微減低一些,資料數量如果是幾十萬筆的等級,用 Excel 處理就相對沒這麼容易,適合使用 Python。幾百到幾千 mega 大小的資料,要考慮我們的硬體記憶體是否能夠運作,不然要往雲的資料處理平台(如 Amazon 付費使用的 aws、Microsoft 免費的 Azure、Google 免費的 Google Cloud)環境考慮,雲平台(一大堆電腦)的功能都蠻完整的,圖形介面處理都相當友善,資料放到雲上就是對全世界公開,不適合公開的需要去識別化或不放敏感資料等處理。
Anaconda(https://www.anaconda.com/) 在產品(Product)欄位點選個人版本,並根據自己電腦的系統工作環境來下載,目前(2020/10)Python 版本是 3.8,早期的作業環境是 32 位元,也要考量安裝後是不是會佔太多空間。安裝完成後預設瀏覽器是 Chrome,打開 Jupyter 對照自己系統的作業系統,並在合適的路徑新增「Python」的資料夾,jupyter 介面中 Files 就會連動到我們設定的資料夾,並在右側點選 New ➫ Python 3,就能跑到可以輸入程式碼分析資料的介面了。前面提到的雲服務,Google Colaboratory 也提供類似 Jupyter 的環境,能夠做同樣的事情~Python 官網也有提供語法文件的整理讓我們初學者參考,如果有不懂的可以到官網上閱讀(https://www.python.org/doc/)。Anaconda(https://www.anaconda.com/)在產品(Product)欄位點選個人版本,並根據自己電腦的系統工作環境來下載,目前(2020/10)Python 版本是 3.8,早期的作業環境是 32 位元,也要考量安裝後是不是會佔太多空間。安裝完成後預設瀏覽器是 Chrome,打開 Jupyter 對照自己系統的作業系統,並在合適的路徑新增「Python」的資料夾,jupyter 介面中 Files 就會連動到我們設定的資料夾,並在右側點選 New ➫ Python 3,就能跑到可以輸入程式碼分析資料的介面了。前面提到的雲服務,Google Colaboratory 也提供類似 Jupyter 的環境,能夠做同樣的事情~Python 官網也有提供語法文件的整理讓我們初學者參考,如果有不懂的可以到官網上閱讀(https://www.python.org/doc/)。Anaconda(https://www.anaconda.com/)在產品(Product)欄位點選個人版本,並根據自己電腦的系統工作環境來下載,目前(2020/10)Python 版本是 3.8,早期的作業環境是 32 位元,也要考量安裝後是不是會佔太多空間。安裝完成後預設瀏覽器是 Chrome,打開 Jupyter 對照自己系統的作業系統,並在合適的路徑新增「Python」的資料夾,jupyter 介面中 Files 就會連動到我們設定的資料夾,並在右側點選 New ➫ Python 3,就能跑到可以輸入程式碼分析資料的介面了。前面提到的雲服務,Google Colaboratory 也提供類似 Jupyter 的環境,能夠做同樣的事情~Python 官網也有提供語法文件的整理讓我們初學者參考,如果有不懂的可以到官網上閱讀(https://www.python.org/doc/)。Anaconda(https://www.anaconda.com/)在產品(Product)欄位點選個人版本,並根據自己電腦的系統工作環境來下載,目前(2020/10)Python 版本是 3.8,早期的作業環境是 32 位元,也要考量安裝後是不是會佔太多空間。安裝完成後預設瀏覽器是 Chrome,打開 Jupyter 對照自己系統的作業系統,並在合適的路徑新增「Python」的資料夾,jupyter 介面中 Files 就會連動到我們設定的資料夾,並在右側點選 New ➫ Python 3,就能跑到可以輸入程式碼分析資料的介面了。前面提到的雲服務,Google Colaboratory 也提供類似 Jupyter 的環境,能夠做同樣的事情~Python 官網也有提供語法文件的整理讓我們初學者參考,如果有不懂的可以到官網上閱讀(https://www.python.org/doc/)。