iT邦幫忙

machine learning相關文章
共有 744 則文章
鐵人賽 AI & Data DAY 20

技術 LLM 和機器學習的介紹-Part 5

續上一篇LLM 和機器學習的介紹-Part 4 ,我們繼續討論一些數據模型(data models)。 實體-關係模型 (Entity Relationship...

鐵人賽 AI & Data DAY 21

技術 [Day 21] Propagation-Based:探索反向傳播法的可解釋性

今天所要談 Propagation-Based 方法在 CNN 中的作用是透過計算梯度、反向傳播或不同層的特徵來量化每個像素或特徵對預測結果的影響。 從昨天的...

鐵人賽 AI & Data DAY 19

技術 Day19-層次聚類 (Hierarchical Clustering)

將所有樣本中相近得樣本點組成一個群組,一層一層往上堆疊,直至所有的樣本皆被分成一個群組為止 Hierarchical Clustering 透過將最接近的...

鐵人賽 AI & Data DAY 19

技術 LLM 和機器學習的介紹-Part 4

續上一篇LLM 和機器學習的介紹-Part 3,我們繼續討論一些數據模型(data models) 牛頓冷卻定律 Newton's Law of Cooling...

鐵人賽 AI & Data DAY 20

技術 [Day 20] Gradient-Based:利用梯度訊息解釋神經網路

在深度學習中梯度訊息扮演著關鍵的角色,尤其在神經網路的訓練過程中。梯度代表了函數相對於參數的變化率,它告訴我們如何調整神經網路的權重和參數,以最小化或最大化一個...

鐵人賽 AI & Data DAY 18

技術 Day18-K-means Clustering

總的來說就是物以類聚 K-means Clustering 將數據集中的數據點分成不同群組,以便相似的數據點彼此靠近 選擇K值: 決定要將資料分成...

鐵人賽 AI & Data DAY 17

技術 LLM 和機器學習的介紹-Part 2

續上一篇LLM 和機器學習的介紹-Part 1,我想更深入地介紹一些數據建模、LLM和機器學習的示例。 統計概念大數據以及machine learning的基礎...

鐵人賽 AI & Data DAY 19

技術 [Day 19] Perturbation-Based:如何用擾動方法解釋神經網路

如果想要了解一張圖片中哪些區域對於 CNN 神經網路的判斷結果具有影響力,可以參考基於擾動的 Perturbation-Based 方法。它有很多不同種的變形,...

鐵人賽 AI & Data DAY 17

技術 Day17-kernel function(核函數)

kernel trick 作天的SVM跟SVR有提到可以用kernel function將資料映射到高維空間中 解決的問題:當資料在原始空間中無法被線性分...

鐵人賽 AI & Data DAY 18

技術 [Day 18] CNN:卷積深度神經網路的解釋方法

在當今的深度學習領域中,卷積神經網路(CNN)已經成為許多電腦視覺任務的首選模型,例如圖像分類、物體偵測、語意分割、動作偵測等,這些重大突破都歸功於卷積神經網路...

鐵人賽 AI & Data DAY 16

技術 Day16-SVM (Support Vector Machine) / SVR (Support Vector Regression)

SVM (Support Vector Machine) 若資料為非線性,將資料映射到高維空間中(用kernel function) 找一超平面將資料分開,...

鐵人賽 AI & Data DAY 17

技術 [Day 17] 解析深度神經網路:使用Deep SHAP進行模型解釋

Feature Attribution Feature Attribution(特徵歸因)是機器學習領域中的一個重要概念,它用於解釋模型的預測結果。當我們訓練機...

鐵人賽 AI & Data DAY 15

技術 Day15-stacking

為強學習機融合方法 stacking 第一層為level 0,第二層為level 1 第一層可包含多個學習機,第二層只能有一個 第一層的學習機被稱為...

鐵人賽 AI & Data DAY 30
ML From Scratch 系列 第 30

技術 [Day 30] Deep Q-Network — 解決真實問題

昨天,我們透過 TUTORIAL 來講解 Deep Q-Network。 今天我們來探索 Deep Deterministic Policy Gradient...

鐵人賽 AI & Data DAY 14

技術 Day14-xgboost( Extreme Gradient Boosting )

是基於 Gradient Boosted Decision Tree (GBDT) 改良與延伸 Boosting XGBoost是一種集成學習技術,通過組...

鐵人賽 AI & Data DAY 16

技術 [Day 16] 神經網路的可解釋性:如何理解深度學習中的黑箱模型?

深度神經網路(DNN)以其線性和非線性的複雜轉換而聞名,因為它涵蓋了許多隱藏層。因此即使給定一個訓練有素並能夠良好分類的 DNN,模型內部的推論過程仍然是個未知...

鐵人賽 AI & Data DAY 29
ML From Scratch 系列 第 29

技術 [Day 29] Deep Q-Network — 主題實作

昨天介紹 Deep Q-Network,今天我們透過 TUTORIAL 來講解 Deep Q-Network。 Impelmentation Import Li...

鐵人賽 AI & Data DAY 15

技術 [Day 15] SHAP實作:實戰演練SHAP解釋方法

昨天已經瞭解了 SHAP 套件背後的核心技術。SHAP 提供多種解釋工具,可應用於不同類型的模型: KernelExplainer(Kernel SHAP):...

鐵人賽 AI & Data DAY 28
ML From Scratch 系列 第 28

技術 [Day 28] Deep Q-Network — 背後理論

由於數學函式有顯示不出來的問題,文章內容請至此閱讀

鐵人賽 AI & Data DAY 13

技術 Day13-Gradient Boosting

boosting 前幾天有寫過一點關於boosting跟bagging大概的概念,今天開始前再簡單說一下 透過組合弱學習機、改進每一次的錯誤、從而獲得一個...

鐵人賽 AI & Data DAY 14

技術 [Day 14] SHAP理論:解析SHAP解釋方法的核心

Shapley values 簡介 Shapley values 最早是由經濟學家 Lloyd Shapley 所提出,用於評估參與合作博弈的每個玩家對於勝利的...

鐵人賽 AI & Data DAY 27
ML From Scratch 系列 第 27

技術 [Day 27] Reinforcement Learning

Reinforcement Learning Reinforcement Learning 是一種機器學習方法,用於使代理(可以是機器、軟件或機器人等)通過與環...

鐵人賽 AI & Data DAY 16

技術 LLM 和機器學習的介紹-Part 1

人工智慧(AI)最近在科技界成為熱門詞彙,每個人都想參與AI領域。我想分享一下我對AI基礎的學習心得,包括:數據建模、語言學習模型(LLM)和機器學習(ML)的...

鐵人賽 AI & Data DAY 12

技術 Day12-Adaboost

原理 組合多個弱學習機來構建一個強學習機 將每個樣本的權重初始化為相等的值 建構弱分類器 將誤差大的資料權重加大 重複2跟3 加權投票決定結果 建構弱...

鐵人賽 AI & Data DAY 13

技術 [Day 13] LIME實作:實戰演練LIME解釋方法

今天我們將深入探討 LIME 的實作細節,包括如何選擇解釋性模型和解釋特徵,以及如何選擇鄰域大小來生成解釋數據。 若想了解 LIME 的核心原理可以參考前一篇文...

鐵人賽 AI & Data DAY 11

技術 Day11-集成學習Ensemble Learning(bagging/boosting)

使用多種學習算法來獲得比單獨使用任何單獨的學習算法更好的預測效果 集成學習 通過建立幾個模型組合來解決單一預測問題 所用來組合的多個模型之間要有差異...

鐵人賽 AI & Data DAY 26
ML From Scratch 系列 第 26

技術 [Day 26] Recurrent Neural Network — 解決真實問題

今天是第 26 天 !!! 我們將會透過 Recurrent Neural Network (RNN) 和 Long Short-Term Memory (LS...

鐵人賽 AI & Data DAY 12

技術 [Day 12] LIME理論:如何用局部線性近似解釋黑箱模型

LIME 的全名是 Local Interpretable Model-agnostic Explanations ,其目的是可以分析模型對於某筆資料為何做出特...

鐵人賽 AI & Data DAY 10

技術 Day10-隨機森林 (Random Forest)

隨機森林是由多棵昨天提過的決策樹組成,適合用在分類問題 原理 由很多顆決策樹組成,他會先從原資料中隨機抽取多個樣本,用這些樣本以隨機特徵選取的方式建立多棵...

鐵人賽 AI & Data DAY 25
ML From Scratch 系列 第 25

技術 [Day 25] Recurrent Neural Network — 主題實作

Dataset Dinosaur Island 一份文字檔,裡頭紀錄許多恐龍的類別。 Implementation Import Library import...