前言 在多元迴歸模型中,我們常常關心是否全部的解釋變數都可以幫助預測反應變數,或是只有部分的解釋變數有用?昨天的內容提到可以解決這類問題常見的方法有子集選取法(...
今日大綱 什麼是邏輯斯迴歸? 最大概似估計 線性迴歸 vs. 邏輯斯迴歸 什麼是邏輯斯迴歸? 邏輯斯迴歸為線性迴歸的變形,其經過sigmoid functi...
前言 昨天介紹了簡單線性迴歸模型的基本架構,當資料只有一個解釋變數或特徵時(一個反應變數Y,多個解釋變數X的情境),這個方法相當方便且容易解釋,但是當資料存在較...
前言 線性迴歸(Linear Regression)是監督式學習中相對比較簡單且容易理解的方法,一種用來建立X(解釋變數/自變數/預測變數/獨立變項/特徵)與連...
今日大綱 資料集 衡量指標 程式碼 資料集 今天我以sklearn所提供的資料集舉例,預測加州不同區的房價,獨立變數與依變數的敘述如下: 獨立變數 Med...
今日大綱 什麼是線性迴歸? 線性迴歸假設 線性迴歸公式 Loss function 什麼是線性迴歸? 線性迴歸是一種統計方法,其利用線性方程式解釋獨立變數(...
在介紹什麼是 AI 之前,先講一個血淋淋的親身經歷來說明 AI 的重要性。 你喜歡玩遊戲嗎? 我以前很愛玩遊戲,特別是那種很花時間要反覆練功升等級的線上遊戲。有...
前言 遺失值(Missing Value)資料的插補也是訓練模型前資料清洗重要的一環,在進行資料分析時資料常常是不完善的,因此需要有一些方法來處理資料遺失的狀況...
前言 大學修人工智慧這堂課時,期末專題實作一個手寫數字辨識系統開啟了我對機器學習學習之路,在此之前只修過一些理工科基礎課。興趣研究約兩年。藉這個機會回顧自己是怎...
前言 在監督式學習中,我們可以將收集而來的資料切割為訓練集與測試集來尋找表現最好的模型,而這兩種資料集就像字面上的意思一樣,訓練集是用來訓練模型,測試集是用來測...
前言 在資料收集愈來愈便利與科學運算愈來愈快的時代下,科學家們致力於找出資料中重要的模式與趨勢,也稱為從資料中學習(learning from data),使得...
今天來分享一篇研究,是由Matthew Houde所撰寫的《Predicting the Outcome of NBA Games》,是一篇利用機器學習的模型去...
在上一篇文章中,我們介紹了作者最終挑選模了Elastic net (L1+L2) penalty regularization(彈性網路正規化)作為最後的預測模...
在上一篇文章中,我們介紹作者如何分析MLB賽事,並找出影響比賽勝負較為重要的因子,而今天我們就來看看作者究竟是選擇了哪些模型進行訓練以及預測,並最終做出能夠預測...
【2022 Global Student Bootcamp - AI 產品實作營】即日起開始報名! 以「開發使用者為導向的產品」為核心概念設計的 Cinnamo...
本文將要介紹由Andrew Y. Cui撰寫的《Forecasting Outcomes of Major League Baseball Games Usin...
在 2000 年代初期,內部稽核團隊的典型工作重點是完成對特定財務和運營領域的傳統週期性稽核——這一過程通常與組織的更大目標脫節。今天的內部稽核職能已經發生了徹...
全民瘋AI系列2.0完賽總結 不知不覺就參加了三屆iT邦鐵人賽,很高興能夠藉由此活動分享經驗與知識。雖然這三十天過程很辛苦,但也透過這種方式督促我整理這些內容。...
使用 Heroku 部署機器學習 API 今日學習目標 動手部署自己的機器學習 API 使用 Heroku 雲端平台部署應用程式 前言 開發的最後一哩路部署...
使用 Python Flask 架設 API 吧! 今日學習目標 API 觀念講解 什麼是 API? RESTful API HTTP Request 方法...
儲存訓練好的模型 今日學習目標 使用 pickle + gzip 儲存模型 將訓練好的模型打包並儲存 載入儲存的模型 讀取打包好的模型並預測 前...
機器學習常犯錯的十件事 今日學習目標 探討機器學習常犯的十件錯誤 前言 人工智慧近年來成為任何產業熱門的話題之一,各公司積極地導入機器學習技術協助產業 AI...
今日學習目標 了解 K-Fold 各種不同變形 K-Fold Cross-Validation Nested K-Fold Cross Validation...
今日學習目標 常見的交叉驗證方法 K-fold Leave one out cross validation Random Subsampling Boot...
今日學習目標 如何選擇最佳的模型? 深入理解度擬合與欠擬合 Bias-Variance Tradeoff 如何避免過擬合與欠擬合? 前言 在機器學習中...
資料分布與離群值處理 今日學習目標 資料特徵觀察與離群值分析 檢視資料的分布狀態 偏度 (Skewness) 峰度 (Kurtosis) 修正特徵偏度的...
Plotly Express 今日學習目標 安裝 plotly 手把手實作視覺化鳶尾花朵資料集 直方圖 特徵關聯度分析 散佈圖 箱形圖 複合型視覺化技巧 匯...
在經過集成式學習(ensemble learning)之後的 tree based (像是 Random Forest, XGBoost, LightGBM)...
Optuna 今日學習目標 Optuna 如何採樣參數? 實作 Optuna 搜尋最佳超參數 以 XGBoost 迴歸模型於房價預測為例 Optuna 視覺...
LightGBM GBDT(Gradient Boosting Decision Tree) 是利用弱分類器迭代訓練來得到最佳的模型,而 LightGBM(Li...