機器學習是什麼 隨著科技的進步,機器學習已成為現代科技發展的重要推動力。從推薦系統到自駕車,機器學習的應用無處不在。本篇文章將帶你入門,了解機器學習的基本概念和...
前言 前面我們實作出了一些基本的模型,而今天我們就拿之前的多元線性回歸模型來當作範例,要把這個模型佈署至網頁上,藉由讓使用者從輸入框傳入特徵資料到模型中,讓模型...
完賽心得 第一次參加鐵人賽,平安度過了~自己有個習慣就是會把有關非學術類的東西都用電子筆記在記,像是使用HackMD、OneNote等等,所以其實也算已經事先囤...
29天啦!之前實作分類器的時候有用到混淆矩陣,今天也來寫一下相關筆記 混淆矩陣(confusion matrix) 可以用來評估分類模型的準確率 混淆...
主題建模 確定它分析的每個文本或文檔中的主題 從整體文本數據推斷主題集群 將包含類似主題集群的文本或文檔組合在一起 文本聚合 將包含相似主題的文字或文件組...
前言 今天我們要來搭建一個簡易模型,這個模型能夠將輸入的圖片做分類的動作,並且要經過多層神經網路的訓練,從而訓練出我們的 DNN 模型,在建模前先來了解下面的基...
再續昨天!今天的筆記把論文剩餘的部分整理完 Hard negative mining 難例挖掘 由於存在大量的負樣本,所以導致嚴重的類別不平衡問題,訓練時...
前言 前幾天做的都是回歸問題的模型,而今天我們做二元分類問題時,就要和大家介紹邏輯回歸 ( Logistic Regression ) 這個模型,我們要讓模型根...
NLP步驟 將文件收集到語料庫內 基元化(語彙基元tokens) 句子基元化&偵測語言 文本通常被分割成句子 pip install langde...
接續作天,今天講訓練相關策略及方法 training Matching strategy 匹配策略 利用jaccard overlap使ground tr...
梯度(Gradient) 是目標函數在某個點的局部斜率或變化率。 梯度提升(Gradient Boosting) 集成學習 多個弱學習器(通常是決策樹)...
今天是大概的概念,training等細節留到明天 VGG-16 SSD的架構是使用VGG-16 13個卷積層+3個全連接層+5個池化層 其卷基層均使用...
整體/集成學習 通過結合多個基本模型的預測結果,獲得更好的整體預測性能。 可以是相同類型的模型,也可以是不同類型的模型。 通過集體決策來消除個別模型的不足,從...
前言 前面理論的東西講了這麼多,大家想必很想動手實作了吧,今天我們就要來著手搭建簡單線性回歸模型,我們要能夠輸入年資 ( 特徵 ) 並讓這個模型根據輸入的資訊去...
決策樹 用於分類和回歸問題。 混亂評估指標 Information Gain (資訊獲利) 衡量了使用某個特徵分割後熵的減少 熵是衡量不確定性的指標。...
CNN的概念圖如下: ( 圖片來源:https://reurl.cc/l7g1LY ) Convolution Layer 卷積層 卷積的主要概念就是特徵擷...
是一種決策樹 決策樹 根據特徵進行分割(同子集內盡量相似) 重複分割直到達到設定的深度 建構決策樹 對決策樹進行遍歷,得出結果 CART流程 所有的樹...
強化學習概論 讓智慧型代理人/智慧體/智能體(intelligent agent)通過與環境的交互學習如何做出決策,以最大化一個獎勵信號。它通常涉及到Agent...
監督式學習(分類-Binary、演繹法) 分類理論(Binary) 通常可以分為二元分類(Binary Classification)和多類別分類(Multic...
前言 在前面【Day 6】回歸與分類 Regression & Classification 的文章中,了解到我們用模型主要來處理的問題任務,也就是回歸...
前言 前面幾天提到過,當一個模型的參數較多,會導致模型複雜度過高,這會讓模型在訓練資料的擬和表現很好,但在新的陌生資料上 ( 測試資料 ) 表現不佳,就會出現過...
是一種基於機率的分類器 貝氏定理 Bayes’ Theorem 計算在已知一些條件下,某事件的發生機率 通常事件A在事件B已發生的條件下發生的機率,與...
前言 昨天提到了模型欠缺擬和與過度擬和的問題,今天就要針對這兩個問題探討兩個評估模型效能的指標,分別是偏差 ( Bias ) 和方差 ( variance ),...
非監督式學習(分群-距離、相似特徵、歸納法) 分群演算法: K-Means 聚類:將數據分為 K 個不同的群集,每個群集由其內部的數據點的相似性來定義。...
利用弱分類器(決策樹)迭代訓練或得強分類器,其具有訓練效果好、不易過擬合等優點。 LightGBM V.S. XGBoost 圖源: https://re...
【Day 21】欠缺擬和與過度擬和 Underfitting & Overfitting 前言 在機器學習中,欠缺擬和 ( Underfitting )...
可以用來降維(dimension reduction),利用原有的特徵組合成新的特徵組,以達到降維的目的,同時保留住資料中的重要資訊 基本上它的目標就是將...
前言 學習和應用機器學習和人工智慧技術,以改進股票分析和預測的準確性。 實作機器學習模型,以預測股票價格和趨勢。 說明 當學習和應用機器學習和人工智慧技術以...
分群理論 群內差異小,群間差異大 找出比較相似的資料聚集在一起,形成集群(Cluster) 相似性的依據是採用歐式距離,相對距離愈近、相似程度越高,被歸類至同...
前言 昨天提到如何算出評估模型的各種驗證指標,今天就要利用驗證指標中的兩個指標,這兩個指標都是針對預測為陽性 ( 1 ) 時的情況下做比率的計算,一個是召回率...