本次參賽以一個初學者的步調,帶領大家一同探索關於Orange這個套件於資料分析的使用,以及與Python連接的相關應用,不只是我吸收知識和實作,且將學習的經驗利用iThome的三十天鐵人賽,將其記錄下來,讓更多人知曉。
在上一篇我們有用到K-means把數據分群以及視覺化其分群效果,但若是沒先了解過K-means的你,經由上篇應該還沒有很懂它的運作方式吧,今天我將帶你一同了解其...
於第二十篇中,我們有提到Silhouette(輪廓),它是一個評估群聚效果的方法,可以幫我們找尋到最佳群聚數。而今天我們就來深入了解其含意,並且利用它來找出數據...
經過了幾次我們對於電腦內的表格或是Orange內分享的資料集進行分析,那其實數據有著許多型式,包括圖像、表格、文本或一段音頻等等,那今天我要為大家介紹的,是如何...
在上一篇中,我們是將許多張未分類過的圖像數據,讓電腦幫我們分類與查看它們之間的相似度(屬於無監督式學習);那麼今天,就是要將另外一群已分類好之圖像數據,進行模型...
在前幾次,我們有用表格與圖像的數據來進行分析,那麼今天要來點不一樣的,換成如標題所說的「文本」做主題啦~~預備備~開始! 安裝文字插件 打開Orange上的工作...
經過上一篇文字預處理後,我們會得到一行行的文本內容,但這樣對於機器學習來說是無法好好讀取訊息的,所以要將這些單字轉換成數值,以便後續操作。來!我們快點開始動手實...
於上一篇,我們懂得如何歸類故事類別,那麼今天將帶大家用機器學習模型對新故事進行分類!我們開始執行吧~ 匯檔→預處理→增加文字轉換成數值之屬性 這邊跟上一篇一樣,...
倒數兩天啦~今天要讓大家自己找檔案試試前幾集以故事為主題的教學,那就直接來囉! 選檔 這次大家可以選幾個類別的故事或文章,接著將它們用txt或tab檔存於檔案中...
在倒數兩天,接著就要跟大家Say Goodbye了,那在完賽前,要跟大家說說以下幾個事項: 鐵人賽中,參考什麼打出這些內容? 範例中,給大家使用的資源從何處來...
終於迎來最後一天了!沒想到這天的到來會讓人如此感動這三十天,每一天都在吸收、成長,並且「學著如何寫出一篇篇教導他人的文章」。以下來跟大家說說又過了30天的心路歷...