iT邦幫忙

machinelearning相關文章
共有 32 則文章

技術 【Day12】2rd:泛化(Generalization)

這篇在說理論,說明何謂「Generalization」,以及要訓練機器學習的時候有什麼原則。 (本篇是Generalization) 何謂「泛化(Genera...

技術 【Day27】3rd:Playground-訓練模型(by TensorFlow)#2

現在使用TensorFlow來訓練我們的這個模組。 以下會有幾個步驟:開始準備、製作特徵、以年齡當做分類的特徵、定義模型特徵、訓練深度神經網路模型、評估神經網路...

技術 【Day13】2rd:訓練與測試資料集

本篇也是進行說明,是關於訓練資料與測試資料相關資訊。 上篇說明模型「泛化」,當我們做出模型的時候,要進行調整與測試,讓我們的預測越接近現況。而在這邊要規劃我們...

技術 【Day26】3rd:Playgrand-公平(Fairness)#1

進入遊戲區體驗Fairness的機器學習,將會練習之前所說的不同的差異以及用子組合,來評估模型性能。 文章 (本篇分成兩章文章) 開始前 資料:用成人普查收入...

技術 【Day11】2rd:TensorFlow初步學習-線性回歸(linear regression)

熟悉TensorFlow的第一步就是製作線性回歸(linear regression),此篇也是從First Steps with TensorFlow而來,以...

技術 【Day9】2rd:Colab-Pandas範例

在Colab跑我們的TensorFlow,其中要pandas範例來練習。Pandas是個重要且流行的套件(library)是個不錯的工具。 (本篇使用firs...

技術 【Day25】3rd:Fairness-評估偏差(evaluating for bias)

在評估模型的時候,會發現模型與結果有誤差,模型無法針對我們的測試集反映出真正結果,這就是評估的偏差(evaluating for bias)。這時候就是需要用到...

技術 【Day4】First:損失函數

機器學習的目標,就是要預測未來,預測能越準越好,但是要怎麼知道準不準確呢?這時候「損失函數」(loss function)就很好用了!當損失函數越小,表示這個m...

技術 【Day17】2rd:特徵十字(Feature Crosses)# 2 -One-Hot Vectors

為解決無法用「線性函數」做區別的資料,除了前一篇所言,還可以使用「Crossing One-Hot Vectors」。(也許可以說「一個熱鍵」?) 文章:cr...

技術 【Day7】2rd:TensorFlow、Colab簡介

現在正式進入TensorFlow的領域,在那之前,TensorFlow到底是什麼呢? TensorFlow一款Google開發的工具,現為開源軟體庫,用於各種...

技術 【Day22】3rd:數據依賴關係(Data Dependencies)

在程式開發中,對於程式的品質非常重要,我們有各個種測試方式測試,最常用的就是單元測試(Unit test)。但是機器學習沒有這樣的機制,只能用直接輸入數據,直接...

技術 【Day20】3rd:靜態與動態訓練(Static vs. Dynamic Training)

文章:Static vs. Dynamic Training 進行模型訓練方式依據資料是否會變動,將分成兩種方式:靜態(static)和動態(dynamic)...

技術 【Day16】2rd:特徵十字(Feature Crosses)

用Feature Crosses讓我們的樣本放入十字表格中,讓模型更容易出來。 教學文章:Feature Crosses 根據網路的文章(特徵組合&特...

技術 【Day28】4th:機器學習+現實世界-癌症預測

開始說明機器學習與現實世界的互動,本篇說明癌症預測 文章:ML Systems in the Real World: Cancer Prediction Go...

技術 【Day10】2rd:DataFrame和Series的更多應用

DataFrame和Series除了前一天教的功能外,還有其他幾個運用,像是Python本身的應用、NumPy、lambda等等。 DataFrame Py...

技術 【Day30】4th:現實案例&機器學習總結(含雜記)

案例說明中,google有提供以下的建議:(文章:ML Systems in the Real World: Guidelines) (列表中會提供相近的本系列...

技術 【Day23】3rd:公平(Fairness)

人對於自己在意的東西都會有所偏頗,可能在給予資料的時候就在不知不覺中進行篩選。要如何維持中立,不偏頗呢?這就是本篇所要探討的重點。 文章:Fairness 在...

技術 【Day5】First:如何減少誤差,找出最適合的模組

前面知道建立模組的參數及一些方法,那要如何找出最適合的模組呢?我們有個公式:y=Wx+B,我們要怎麼找到「W」和「B」的最佳值,也就是最小的誤差呢?當然是一個一...

技術 【Day14】2rd:驗證集

有了訓練、測試等資料集,要驗證模組是否正確,也就需要驗證集(validation data) 〈圖一、訓練與測試集〉 我們把資料分成兩個部分,一個是訓練集,一...

技術 【Day15】2rd:表現(Representation)

先前說了資料集的處理及分配,但是到底資料要如何提供呢?怎樣的資料才是好的呢? 資料處理是機器學習重要的一環,資料找出特徵,讓資料得以表現出他的價值,也就是可以給...

技術 【Day6】First:遊戲區

Google提供一個遊戲區,讓我們學習並且觀察他們是如何執行機器學習的,還有學習的效率為何。 遊戲區在這兒:說明網站、遊戲區其中要注意的是,每次「reset」...

技術 【Day21】3rd:靜態推理vs動態推理

本篇要學習靜態和動態推理,這是在機器學習中所要選擇的兩種不同推理。 文章:Static vs. Dynamic Inference 在設計機器學習中,有一環要...

技術 【Day3】First:框架(frame)與流程

在真正開始前,需要先了解一下機器學習所需要用的框架,在依這個框架下,進行學習的討論及實驗。(參考網站:Framing) 我們進行的是監督式機器學習,也就是說建...

技術 【Day29】4th:現實案例-隱喻和政治傾向

google和研究文學的教授一同研究,看能不能用隱喻的作品資料,去預測作者的政治傾向。在完成模型後,他們發現準確率超高,到底是為什麼呢? 文章:ML Syste...

技術 【Day19】3rd:Google機器學習環境

本篇會講一些Google提供的機器學習之環境到底是怎樣,如何協助我們。文章:Production ML Systems 這是課程中描繪的圖片: 明顯的看得出來...

技術 【Day8】休息:分享網站

這幾天看到幾篇不錯的文章,有的跟技術沒有關係,但是觀念很多,或是說明一些數學、算式說明。看到那些文章才發現機器學習並非我想的那麼簡單,只是個工具的使用,而是絕大...

技術 【Day1】First:起源

原本想要了解時下最流行的議題:機器學習(Machine learning),但還沒有決定要從哪裡著手,剛好看到本次鐵人賽有個主題「Google Develope...

技術 【Day24】3rd:Fairness之確定偏見(Identifying Bias)

在資料中有哪些偏見會產生呢?讓我們看下去 文章:Fairness: Identifying Bias Missing Feature Values:我們的...

技術 【Day2】First:所需的技能與工具

在開始前,Google教學有提到,在學習機器學習的時候,有些知識或是工具也要會的,像是數學(例如代數、線性代數,也就是理論的部份)、Python能力(要撰寫程式...

技術 Kaggle機器學習進階課程總結:

課程主要是在於更好的優化data transform的時候data本身的優化處理:Permutation importance:通過隨機排列參數,凸顯出哪些fe...