iT邦幫忙

機器學習相關文章
共有 366 則文章
鐵人賽 AI & Data DAY 30

技術 【Day 30】Web 應用程式佈署 ( 二 ) 之最終回

前言 前面我們實作出了一些基本的模型,而今天我們就拿之前的多元線性回歸模型來當作範例,要把這個模型佈署至網頁上,藉由讓使用者從輸入框傳入特徵資料到模型中,讓模型...

鐵人賽 AI & Data DAY 30

技術 [DAY30] 關於我從基礎程設轉職到人工智慧入門

完賽心得 第一次參加鐵人賽,平安度過了~自己有個習慣就是會把有關非學術類的東西都用電子筆記在記,像是使用HackMD、OneNote等等,所以其實也算已經事先囤...

鐵人賽 AI & Data DAY 29

技術 Day29-混淆矩陣(confusion matrix)

29天啦!之前實作分類器的時候有用到混淆矩陣,今天也來寫一下相關筆記 混淆矩陣(confusion matrix) 可以用來評估分類模型的準確率 混淆...

鐵人賽 AI & Data DAY 29

技術 [DAY29] 機器學習 - 自然語言NLP(二)

主題建模 確定它分析的每個文本或文檔中的主題 從整體文本數據推斷主題集群 將包含類似主題集群的文本或文檔組合在一起 文本聚合 將包含相似主題的文字或文件組...

鐵人賽 AI & Data DAY 28

技術 【Day 28】《實作》多元分類 - DNN 模型

前言 今天我們要來搭建一個簡易模型,這個模型能夠將輸入的圖片做分類的動作,並且要經過多層神經網路的訓練,從而訓練出我們的 DNN 模型,在建模前先來了解下面的基...

鐵人賽 AI & Data DAY 28

技術 Day28-Single Shot MultiBox Detector (SSD) part3

再續昨天!今天的筆記把論文剩餘的部分整理完 Hard negative mining 難例挖掘 由於存在大量的負樣本,所以導致嚴重的類別不平衡問題,訓練時...

鐵人賽 AI & Data DAY 28

技術 [DAY28] 機器學習 - 自然語言NLP(一)

NLP步驟 將文件收集到語料庫內 基元化(語彙基元tokens) 句子基元化&偵測語言 文本通常被分割成句子 pip install langde...

鐵人賽 AI & Data DAY 27

技術 【Day 27】《實作》二元分類 - 邏輯回歸模型

前言 前幾天做的都是回歸問題的模型,而今天我們做二元分類問題時,就要和大家介紹邏輯回歸 ( Logistic Regression ) 這個模型,我們要讓模型根...

鐵人賽 AI & Data DAY 27

技術 # Day27-Single Shot MultiBox Detector (SSD) part2

接續作天,今天講訓練相關策略及方法 training Matching strategy 匹配策略 利用jaccard overlap使ground tr...

鐵人賽 AI & Data DAY 27

技術 [DAY27] 機器學習 - 決策樹(三)

梯度(Gradient) 是目標函數在某個點的局部斜率或變化率。 梯度提升(Gradient Boosting) 集成學習 多個弱學習器(通常是決策樹)...

鐵人賽 AI & Data DAY 26

技術 # Day26-Single Shot MultiBox Detector (SSD) part1

今天是大概的概念,training等細節留到明天 VGG-16 SSD的架構是使用VGG-16 13個卷積層+3個全連接層+5個池化層 其卷基層均使用...

鐵人賽 AI & Data DAY 26

技術 [DAY26] 機器學習 - 決策樹(二)

整體/集成學習 通過結合多個基本模型的預測結果,獲得更好的整體預測性能。 可以是相同類型的模型,也可以是不同類型的模型。 通過集體決策來消除個別模型的不足,從...

鐵人賽 AI & Data DAY 25

技術 【Day 25】《實作》搭建簡單線性回歸模型

前言 前面理論的東西講了這麼多,大家想必很想動手實作了吧,今天我們就要來著手搭建簡單線性回歸模型,我們要能夠輸入年資 ( 特徵 ) 並讓這個模型根據輸入的資訊去...

鐵人賽 AI & Data DAY 25

技術 [DAY25] 機器學習 - 決策樹(一)

決策樹 用於分類和回歸問題。 混亂評估指標 Information Gain (資訊獲利) 衡量了使用某個特徵分割後熵的減少 熵是衡量不確定性的指標。...

鐵人賽 AI & Data DAY 25

技術 Day25-CNN 卷積神經網路(Convolutional neural network)

CNN的概念圖如下: ( 圖片來源:https://reurl.cc/l7g1LY ) Convolution Layer 卷積層 卷積的主要概念就是特徵擷...

鐵人賽 AI & Data DAY 24

技術 【Day 24】回歸器 Regressor 與分類器 Classifier

前言 在前面【Day 6】回歸與分類 Regression & Classification 的文章中,了解到我們用模型主要來處理的問題任務,也就是回歸...

鐵人賽 AI & Data DAY 24

技術 Day24-CART(Classification and Regression Trees)

是一種決策樹 決策樹 根據特徵進行分割(同子集內盡量相似) 重複分割直到達到設定的深度 建構決策樹 對決策樹進行遍歷,得出結果 CART流程 所有的樹...

鐵人賽 AI & Data DAY 24

技術 [DAY24] 機器學習 - 強化學習

強化學習概論 讓智慧型代理人/智慧體/智能體(intelligent agent)通過與環境的交互學習如何做出決策,以最大化一個獎勵信號。它通常涉及到Agent...

鐵人賽 AI & Data DAY 23

技術 [DAY23] 機器學習 - 分群與分類(三) 監督學習

監督式學習(分類-Binary、演繹法) 分類理論(Binary) 通常可以分為二元分類(Binary Classification)和多類別分類(Multic...

鐵人賽 AI & Data DAY 23

技術 【Day 23】正則化 Regularization

前言 前面幾天提到過,當一個模型的參數較多,會導致模型複雜度過高,這會讓模型在訓練資料的擬和表現很好,但在新的陌生資料上 ( 測試資料 ) 表現不佳,就會出現過...

鐵人賽 AI & Data DAY 23

技術 Day23-Naive Bayes Classifier

是一種基於機率的分類器 貝氏定理 Bayes’ Theorem 計算在已知一些條件下,某事件的發生機率 通常事件A在事件B已發生的條件下發生的機率,與...

鐵人賽 AI & Data DAY 22

技術 [DAY22] 機器學習 - 分群與分類(二) 非監督學習

非監督式學習(分群-距離、相似特徵、歸納法) 分群演算法: K-Means 聚類:將數據分為 K 個不同的群集,每個群集由其內部的數據點的相似性來定義。...

鐵人賽 AI & Data DAY 22

技術 【Day 22】偏差與方差 Bias & Variance

前言 昨天提到了模型欠缺擬和與過度擬和的問題,今天就要針對這兩個問題探討兩個評估模型效能的指標,分別是偏差 ( Bias ) 和方差 ( variance ),...

鐵人賽 AI & Data DAY 22

技術 Day22-LightGBM(Light Gradient Boosting Machine)

利用弱分類器(決策樹)迭代訓練或得強分類器,其具有訓練效果好、不易過擬合等優點。 LightGBM V.S. XGBoost 圖源: https://re...

鐵人賽 AI & Data DAY 21

技術 【Day 21】欠缺擬和與過度擬和 Underfitting & Overfitting

【Day 21】欠缺擬和與過度擬和 Underfitting & Overfitting 前言 在機器學習中,欠缺擬和 ( Underfitting )...

鐵人賽 AI & Data DAY 21

技術 Day21-主成分分析 (Principal Component Analysis)

可以用來降維(dimension reduction),利用原有的特徵組合成新的特徵組,以達到降維的目的,同時保留住資料中的重要資訊 基本上它的目標就是將...

鐵人賽 自我挑戰組 DAY 21

技術 Day21:增加機器學習和人工智慧

前言 學習和應用機器學習和人工智慧技術,以改進股票分析和預測的準確性。 實作機器學習模型,以預測股票價格和趨勢。 說明 當學習和應用機器學習和人工智慧技術以...

鐵人賽 AI & Data DAY 21

技術 [DAY21] 機器學習 - 分群與分類(一)

分群理論 群內差異小,群間差異大 找出比較相似的資料聚集在一起,形成集群(Cluster) 相似性的依據是採用歐式距離,相對距離愈近、相似程度越高,被歸類至同...

鐵人賽 AI & Data DAY 20

技術 【Day 20】模型評估(三) : ROC / AUC 特性曲線

前言 昨天提到如何算出評估模型的各種驗證指標,今天就要利用驗證指標中的兩個指標,這兩個指標都是針對預測為陽性 ( 1 ) 時的情況下做比率的計算,一個是召回率...

鐵人賽 AI & Data DAY 20

技術 [DAY20] 機器學習 - 支援向量機(二)

決策邊界(Decision Boundary) 分類問題: 二元或多元分類問題 二元分類: 決策邊界是一條線、曲線或超平面 多元分類: 決策邊界是多維...