「Big Data」應該是近來最紅的詞之一吧。
我想許多人應該都跟過去的我一樣,只知道是個詞,只知道他很火。
近來偶然學習了跟 big data 相關的技術 -- data mining。
我將在三十天寫寫我所學習的資料探勘的基礎,希望能給同樣對這個領域有興趣但未入門的人一點點參考。
好吧,這是小弟第二次參賽,上次半途而廢了 上課上得要死要活還要準備文章真的不容易啊 XD 這次剛好有接觸到一些 data mining 的東西,想說可以來稍微...
# 數據挖掘, 挖什麼? 在過去,小規模的資料分析只要靠人就可以做了,然而隨著網路的發展以及資料儲存技術的提升,資料越來越多,慢慢出現那種資料量大到無法以人工的...
應用案例這回事網路上很多,也有各種書籍跟論文在介紹和探討不同領域的應用,這邊就大概講一下有什麼比較常見的應用吧。 商業上的應用 商業應用算一般人滿常見到的一種資...
Weka 是...? Weka (Waikato Environment for Knowledge Analysis),是一套提供 data mining...
# 四種學習種類 在分析資料之前,我們得先決定要讓我們的機器做怎麼樣的學習、想要得到什麼樣子的結果,有四種基本的形式: 分類學習(classification...
# 資料的呈現 當我們決定了我們的分析目標後,就必須找一個方式來整理資料,如果資料沒有經過整理,就會像一堆糾纏在一起的毛線一樣,根本無從去做分析跟理解。 資料有...
# 分析檔案的第一步 準備輸入檔案是任何分析的第一步,但並不是把想要的研究的資料湊在一起就好, 除了必須依照程式的規格來建構檔案,也因為現實中的資料往往存在著各...
# 如何呈現資料 在先前介紹資料處理的第一步時,有說到我們可以依據不同的需求,進行不同種類的學習模式,來取得我們所需的資訊。 為了能夠精準的表達不同學習模式的結...
# Trees 這就是 tree,又稱為 decision tree。 樹幫助我們根據資料的屬性,來表達分類或者決策的結果,樹可以由上到下,很清晰地表達一個分...
# 單純的呈現方式:Instance-based Representation Instance-based representation 其實滿原始的,這個方...