iT邦幫忙

學習筆記相關文章
共有 535 則文章
鐵人賽 AI & Data DAY 19

技術 重啟旅程~半監督式學習

半監督學習(Semi-supervised learning) 處理的訓練資料中有答案的資料和沒有答案的資料,半監督學習就是利用兩者的資料,來改善模型性能 L...

鐵人賽 AI & Data DAY 19

技術 Day19-層次聚類 (Hierarchical Clustering)

將所有樣本中相近得樣本點組成一個群組,一層一層往上堆疊,直至所有的樣本皆被分成一個群組為止 Hierarchical Clustering 透過將最接近的...

鐵人賽 AI & Data DAY 18

技術 探索神經~神經元與神經網路

神經元與神經網路 細胞核細胞核控制神經元的基本生命過程在類神經網路中,類似的功能由模型的參數(權重和偏差)控制,參數會通過訓練過程來調整 軸突( Axon...

鐵人賽 AI & Data DAY 18

技術 Day18-K-means Clustering

總的來說就是物以類聚 K-means Clustering 將數據集中的數據點分成不同群組,以便相似的數據點彼此靠近 選擇K值: 決定要將資料分成...

鐵人賽 AI & Data DAY 17

技術 Day17-kernel function(核函數)

kernel trick 作天的SVM跟SVR有提到可以用kernel function將資料映射到高維空間中 解決的問題:當資料在原始空間中無法被線性分...

鐵人賽 AI & Data DAY 17

技術 深入探險~深度學習的基本概念

深度學習 是機器學習的一個分支,通過多層神經網絡來模擬和學習複雜的資料 神經網絡( Neural Network ) 深度學習的核心是神經網絡,這是由多個神經元...

鐵人賽 AI & Data DAY 16

技術 物以類聚~層次聚類

層次聚類( Hierarchical Clustering ) 將資料集中的資料點分為不同群集的方法,群集之間形成一種層次結構,代表可以查看不同層次的群集結構,...

鐵人賽 AI & Data DAY 16

技術 Day16-SVM (Support Vector Machine) / SVR (Support Vector Regression)

SVM (Support Vector Machine) 若資料為非線性,將資料映射到高維空間中(用kernel function) 找一超平面將資料分開,...

鐵人賽 AI & Data DAY 15

技術 物以類聚~k-平均演算法

k-平均演算法(K-Means Clustering) 步驟 初始化: 從資料集中隨機選擇K個資料點作為初始群集中心,中心可以是資料集中的實際資料點或隨機生...

鐵人賽 AI & Data DAY 15

技術 Day15-stacking

為強學習機融合方法 stacking 第一層為level 0,第二層為level 1 第一層可包含多個學習機,第二層只能有一個 第一層的學習機被稱為...

鐵人賽 AI & Data DAY 14

技術 召集夥伴~集成學習

在前幾篇有提到關於 Ensemble 這個名詞,是之前都沒學過的東東,所以今天想要來一起了解這是個啥,其實我已經感受到我的鐵人賽學習順序非常混亂,但就先這樣吧,...

鐵人賽 AI & Data DAY 14

技術 Day14-xgboost( Extreme Gradient Boosting )

是基於 Gradient Boosted Decision Tree (GBDT) 改良與延伸 Boosting XGBoost是一種集成學習技術,通過組...

鐵人賽 AI & Data DAY 13

技術 重啟旅程~非監督式學習介紹

非監督式學習( unsupervised learning ) 沒有給定事先標記過的訓練資料,自動對輸入的資料進行分類或分群 非監督式學習的區別與監督式學習...

鐵人賽 AI & Data DAY 13

技術 Day13-Gradient Boosting

boosting 前幾天有寫過一點關於boosting跟bagging大概的概念,今天開始前再簡單說一下 透過組合弱學習機、改進每一次的錯誤、從而獲得一個...

鐵人賽 AI & Data DAY 12

技術 Into The Woods~隨機森林

昨天八點多睡,今天今神飽滿,終於筆者的每日日記回來了在這裡寫日記也不太對就是了,今天的標題有私心,這是一部我蠻喜歡的音樂劇,大家應該也看過,有被改編成電影(魔法...

鐵人賽 AI & Data DAY 12

技術 Day12-Adaboost

原理 組合多個弱學習機來構建一個強學習機 將每個樣本的權重初始化為相等的值 建構弱分類器 將誤差大的資料權重加大 重複2跟3 加權投票決定結果 建構弱...

鐵人賽 AI & Data DAY 11

技術 樹下休息~決策樹

決策樹( Decision Tree ) 是用於分類和迴歸任務,一系列的規則和條件來對資料進行分類或預測 節點(Node) 每個節點表示一個特徵或屬性,對資...

鐵人賽 AI & Data DAY 11

技術 Day11-集成學習Ensemble Learning(bagging/boosting)

使用多種學習算法來獲得比單獨使用任何單獨的學習算法更好的預測效果 集成學習 通過建立幾個模型組合來解決單一預測問題 所用來組合的多個模型之間要有差異...

鐵人賽 AI & Data DAY 10

技術 Day10-隨機森林 (Random Forest)

隨機森林是由多棵昨天提過的決策樹組成,適合用在分類問題 原理 由很多顆決策樹組成,他會先從原資料中隨機抽取多個樣本,用這些樣本以隨機特徵選取的方式建立多棵...

鐵人賽 AI & Data DAY 10

技術 學習小法術~正則化跟正規化

好困、好忙、好累 正則化( Regularization ) 正則化主要用於防止模型 Overfitting 正則化方法( Lp 正則項) 通過向損失函數添加...

鐵人賽 AI & Data DAY 9

技術 重啟旅途~監督式學習 —— 線性迴歸和邏輯迴歸

NCPC 小炮灰,謝謝你簽到題,至少不是 0。 線性迴歸( Linear Regression ) 用於預測未知資料的值找多個自變數( independent...

鐵人賽 AI & Data DAY 9

技術 Day9-決策樹 (Decision Trees)

主要用於分類,也可以改為回歸樹(不建議),今天只討論單顆決測樹,明天會學習多顆決策樹組合成的隨機森林 決策樹原理 對資料重複進行二元分割,形成樹狀結構 根...

鐵人賽 AI & Data DAY 8

技術 中途休息站 —— 簡單介紹機器學習模型的概念

筆者今天不用補課很快樂,但生理時鐘還是讓我在九點多就醒了,可惡我以為今天會睡爽爽地說,但早上不用通勤很快樂,總之讓我們開始今天的筆記吧! 今天說一些機器學習...

鐵人賽 AI & Data DAY 8

技術 Day8-SGDregressor (Stochastic Gradient Descent Regressor)

前幾天的迴歸模型中,我們希望找到一個函數能最好的表達因變數與自變數之間的關係,而尋找這個函數的方法就是定義損失函數(loss function)或稱成本函數(...

鐵人賽 AI & Data DAY 7

技術 中途休息站 —— 一些機器學習模型評估指標

昨天很快樂的開始說監督式學習,突然發現有東西沒說到,所以補到今天,這就是當天想當天主題的可悲,總之今天來寫寫模型得一些東東。 不知道為甚麼一職寫關於介紹的東...

鐵人賽 AI & Data DAY 7

技術 Day7-邏輯回歸 (Logistic Regression)

前幾天有提過的線性回歸是用來預測一個連續的值,而今天要學的邏輯回歸則是用來做分類用的 線性回歸 V.S. 邏輯回歸 線性回歸:找到一條線,讓data盡可...

鐵人賽 AI & Data DAY 6

技術 踏上旅途~監督式學習 —— 簡單介紹二元分類和多元分類

熬夜沒睡飽好像成為每天必抱怨的事項了,今天畢竟踏上旅途,我們話少一些,直接開始吧! 我們在一開始有簡單說明機器學習的類型今天的內容就是要來仔細說一下關於這些...

鐵人賽 AI & Data DAY 6

技術 Day6-多項式回歸(Polynomial Regression)

在前幾天的筆記中有介紹過線性回歸(Linear Regression),線性回歸中的因變數與自變數呈現直線關係(線性關係),但實際上直線並不一定能很好的展現因...

鐵人賽 AI & Data DAY 5

技術 冒險前準備~Python中的資料處理工具 —— Matplotlib

昨天睡太少,睡眠債讓我早上直接睡爛,最後被遊戲體力沒清這件事給嚇醒了。也快到假日了,但鐵人賽內容說不定會變少,主要是星期日有 NCPC ,筆者為了學分有報名,而...

鐵人賽 AI & Data DAY 4

技術 冒險前準備~Python中的資料處理工具 —— Pandas

今天早八,筆者昨天還做死玩遊戲到很晚,可以非常想睡了,但把畢業專題的老師找到了!嗚呼~那今天的內容不出意外是 Pandas 本來昨天要一起說得但晚上有點來不及所...