前兩天介紹了線性回歸和幾種正規化方法的概念,今天來講要如何使用python實作,以及幾種常用參數介紹 環境建置 在開始之前先講一下我所使用的環境! Ana...
昨天我們稍微講了一下如何透過一些基本的圖來讓在做資料分析的時候有一個初步的認識但有的時候我們的資料維度還是實在太多了,這個時候適當的使用一些降維技巧也可以幫助我...
接著昨天的資料處理繼續說明,今天來看看類別資料轉換、資料降維、資料切割、交叉驗證以及不不均衡的對應方法。OS:資料預處理真的很重要啊啊!! 5.類別資料轉換 由...
雖然好的模型和參數可以提高成效,但通常最關鍵還是資料本身。基本上資料的品質決定了八成以上模型的成效,因此大家有必要對自己的資料有所認識和了解。 而在做機器學習的...
前言 「指月錄」卷二十八有道: 「見山是山,見水是水;見山不是山,見水不是水;見山仍是山,見水仍是水。」 這乃是學習深度學習時三種不同的境界,從只看表面、看...
有趣的toy datasets make_moons() make_circles()取自sklearn範例,machine learning toy dat...
本文重點:細針活體切片、乳房腫瘤、Sklearn模型、預測完整代碼+csv+model 在GitHub(一)、認識資料集:Breast cancer Datas...
數據集的使用,常常令人一頭霧水,舉例來說,iris dataset這個最常用的資料集。用一行代碼就可以把資料集放進來了iris = datasets.load_...
上午: 網站設計與網頁工程技術 # 連接資料庫 import sqlite3 import numpy as np con = sqlite3.connect(...
嗨,今天是第28天! 今天要來聊聊機器學習中的特徵標準化(normalization),包含: 什麼是特徵標準化? 為什麼要標準化? 特徵標準化怎麼做? 什...
嗨,今天是鐵人賽的第27天啦!今天要介紹的是一個簡單的預測法:線性迴歸(linear regression)! 主要內容: 什麼是線性迴歸 建立隨機迴歸資料...
嗨!今天是第26天,之前介紹完了基本的機器學習概念了,這次要說明一個K-近鄰演算法(K Nearest Neighbor)! 主要內容: 什麼是KNN 如何用...
嗨,今天是第25天,昨天開始介紹了何謂機器學習,機器學習有哪些類型,今天我們說明機器學習內的名詞:特徵(features)與標籤(labels),未來也會用這個...