在前幾次,我們有用表格與圖像的數據來進行分析,那麼今天要來點不一樣的,換成如標題所說的「文本」做主題啦~~預備備~開始! 安裝文字插件 打開Orange上的工作...
前言 鐵人賽來到了最後兩天,其幾天的內容屬於機器學習中監督式學習(Supervised learning)的模型,這兩天將撰寫的是兩種非監督式學習(Unsupe...
在上一篇中,我們是將許多張未分類過的圖像數據,讓電腦幫我們分類與查看它們之間的相似度(屬於無監督式學習);那麼今天,就是要將另外一群已分類好之圖像數據,進行模型...
前言 昨天介紹了Single Layer Neural network與Deep Neural Network,而模型的結構在隱藏層(hidden layer)...
前言 類神經網路(Neural Network, NN),又稱為神經網路、人工神經網路(Artificial Neural Network, ANN),屬於非線...
前言 過去內容提到的Optimal Separating Hyperplane、Support Vector Classifier與LDA等方法,都是利用線性的...
經過了幾次我們對於電腦內的表格或是Orange內分享的資料集進行分析,那其實數據有著許多型式,包括圖像、表格、文本或一段音頻等等,那今天我要為大家介紹的,是如何...
前言 昨天的內容提到當資料可以完美的利用一條直線或超平面(hyperplane)分類時,**最大邊距分類器(Maximal Margin Classifier)...
於第二十篇中,我們有提到Silhouette(輪廓),它是一個評估群聚效果的方法,可以幫我們找尋到最佳群聚數。而今天我們就來深入了解其含意,並且利用它來找出數據...
在上一篇我們有用到K-means把數據分群以及視覺化其分群效果,但若是沒先了解過K-means的你,經由上篇應該還沒有很懂它的運作方式吧,今天我將帶你一同了解其...
來到了鐵人賽的2/3天數了!再撐十天就可以完賽啦~好興奮壓>□< 我們要堅持下去壓,我相信若有看完的你們,一定會感到很充實der!準備好,我們就繼續...
前言 支持向量機(Support Vector Machine, SVM),是Vladimir Vapnik在 1960 年代首次開發的一類統計模型。在近幾年,...
前言 昨天的內容提到Bagging與Boosting改善預測結果的方法,不過在許多問題中Boosting常常表現得比Bagging更好,因此Boosting這類...
在上篇我們有用到wine這個內鍵數據集,今天一樣要用它來帶大家挑出主要影響分類的屬性!我們開始著手吧~ 分類型數據集評估 在上篇有說到,這組數據為義大利同一地區...
前言 集成學習(Ensemble Learning)是一種將多個模型整合起來,最後獲得比單一個模型表現更好的方法,例如在某筆資料集中可以使用KNN、線性迴歸模型...
過了一個假日,我們要在來繼續科普各位啦~但!今天是個特別的日子,因為是最後一篇科普篇惹,希望這天大家都能好好吸收,為往後實作篇打好基礎!(不過齁,若你是喜歡被科...
載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...
前言 昨天的內容提到針對迴歸的問題如何建立決策樹模型,可以針對訓練集的資料有一個好的預測,但是以昨天提到的方式建立一個完美的決策樹模型後,會使得整棵樹的分支很多...
前言與介紹 決策樹(Decision tree)在機器學習中是一種容易理解但強大的演算法,可以用來處理分類以及迴歸的問題(Classification and...
今天又是科普日~偷偷預告大家一下,科普篇剩不多惹,如果你是喜歡被科普的人,得好好珍惜剩下的幾篇啦,但若你是不喜歡的,那我也恭喜你快撐過去啦,剩沒幾篇,接下來幾乎...
前言 重新抽樣(Resampling)的方法在機器學習或深度學習領域是一個非常重要工具,由訓練集(trainning set)中重新抽樣獲得樣本,在每個樣本上建...
載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...
終於到了實作天,今天將會教導大家如何評估模型,準備好我們就開始囉~ 匯檔、建模型 這次我們將用回鳶尾花數據集來呈現,匯入File後,先用個簡單的分類方法訓練模型...
於上篇實作完之後,大家是否對於自己的操作上更進一步了呢,今天我們要來繼續為大家增加小知識,希望在操作上能得心應手外,還能在道理上融會貫通,一同更上一層樓!那就開...
前言與介紹 在分類問題中除了邏輯斯迴歸模型外,還有另一種常用的方法為線性判別分析(Linear discriminant analysis, LDA),主要概念...
經過了前兩天補充的小知識,今天我們就來用Orange做個預測看看唄! 匯入檔案&檢查 這次用到的數據是水果與蔬菜的訓練集,需要的人可以直接點擊超連結進入...
經過了上一篇了解了Tree,今天我們要再來繼續科普啦~ 邏輯迴歸(Logistic Regression) 為一種統計分析方法,它會根據數據集的先前觀察,來預...
模型學習完成之後,怎麼驗證模型學習的效果好不好,預測準不準確,就是今天要講的模型的評價方法。 交叉驗證(Cross validation) 監督式學習需要有資料...
載入套件 import pandas as pd from sklearn.model_selection import train_test_split fr...
大家好,來到我們第十天嚕~今天我們要來談談Tree,因為在後續的實作都會應用到,所以再來繼續科普一下大家,在我們了解分類和迴歸之前,先來初步了解決策樹吧! 決策...