iT邦幫忙

資料探勘相關文章
共有 31 則文章

技術 【Day 01】經濟部112 年度 營運智慧分析師 能力鑑定 (初級)

前言 10年前學校教的 「資料探勘」 再到現在的 「數據分析」 已經慢慢朝向按照 產業專精 甚至最終 「數據科學 (人工智慧)」 ~ 其實總的來說對於數據的敏...

鐵人賽 開發鐵人 DAY 30

技術 Data Mining 的未來與狂想/貘的資料探勘30講

話說甚麼是 Data Mining 這新名詞, 事實上在系統的觀點就是如何利用電腦與網路讓人的生活過得更好, 而用甚麼技術不是那麼重要. 某位大師說過, 人工智...

鐵人賽 開發鐵人 DAY 29

技術 Data Mining 的可能性/貘的資料探勘30講

在許多 "專家" 認為, Web 3.0 將會是個 Semantic Web 技術已經成熟並應用在許多網站上的未來, 這個語意網路, 在部份...

鐵人賽 開發鐵人 DAY 28

技術 Data Mining 成功案例/貘的資料探勘30講

的確大家知道 xxx 公司的 AlsoBuy 關聯購買是個成功案例, 而 CIA 的個人關鍵字的搜尋倒只是個搜尋結果的個人化, 而在之後的第二次 "遇...

鐵人賽 開發鐵人 DAY 27

技術 關鍵字分析(Text Mining)/貘的資料探勘30講

在上上篇提到無模型預測是我認為值得寫成論文但沒寫成論文的創作, 倒是有幾個作品都被寫成論文, 倒是都不是我的, 而另一個我認為很值的寫的就是在關鍵字分析中的一項...

鐵人賽 開發鐵人 DAY 26

技術 部落格的關連分析/貘的資料探勘30講

沒有一種方法或觀點可以適用所有的角度,尤其像資料探勘這種系統, 可能要更多的模型才能趨近現實. 部落格觀察有三個初始的目標, 有一個在我的定義中是用來找出部落格...

鐵人賽 開發鐵人 DAY 25

技術 無模型預測/貘的資料探勘30講

高樓從平地起, 人總是站在偉人的肩膀上, 在完成曠世論文之前一定已經有許多研究成果了, 任何創意的前提是要沉浸在其環境, ..... 我們常說很多事情都是因為一...

鐵人賽 開發鐵人 DAY 24

技術 單品, 單人/貘的資料探勘30講

在一般的統計分析中, 無論是因子分析或其他方式, 最後一定是去作分類與分群, 也就是在一定的 "Sector" 區間, 在 EC 電子商務中...

鐵人賽 開發鐵人 DAY 23

技術 Data Mining 的跨領域/貘的資料探勘30講

我之前說過, Data Mining 若真的要說的話, 這不會比 "企業管理" 這個字的包含性更窄, 當然是不能比擬的, 但你若把 Data...

鐵人賽 開發鐵人 DAY 22

技術 Data Mining 中企劃與產品經理的角色/貘的資料探勘30講

在身為一個企劃, 執行者, 產品經理或者是操作他的人, 當然真的要去運作或參與 Data Mining 的系統, 前提一定是要了解甚麼是資料探勘, 這樣才有可能...

鐵人賽 開發鐵人 DAY 21

技術 給 SA 做 Data Mining 的建議/貘的資料探勘30講

這邊的 SA 是 System Administrtor 還是 System Analysist 都是可以的, 因為一個系統分析, 必然要對系統架構與管理有點熟...

鐵人賽 開發鐵人 DAY 20

技術 Data Mining 中資料庫管理師 DBA 的幾個偏執好習慣/貘的資料探勘30講

在資料探勘中, 最重要的就是資料的計算與處理, 但無論說要計算前, 一定要先儲存, 且之中一定要讀取, 而這資料要做為儲存與讀取的介面就是指資料庫, 也就是說,...

鐵人賽 開發鐵人 DAY 19

技術 Data Mining 中程式設計師的幾個偏執好習慣/貘的資料探勘30講

雖說是好習慣, 但基本上還是偏執的, 也就是說並無法適用在全面性的地方, 尤其是資料探勘以外的地方, 尤其我本身不是個好的程式設計師, 所以這篇純脆只是給考慮或...

鐵人賽 開發鐵人 DAY 18

技術 指數的價值/貘的資料探勘30講

在 Data Mining 中, 通常要定義一個指數 (Index), 這個指數可能是純量 (Scale), 也可能是向量 (Vector), 但通常若是要人理...

鐵人賽 開發鐵人 DAY 17

技術 Data Mining 的理論基礎, 眾人智慧/貘的資料探勘30講

記得在研究所某個老師對 "人工智慧" 下個定義, 說為甚麼會被稱為人工智慧是因為這還不成熟, 因此沒人知道這是甚麼, 在 50 年代的人工智...

鐵人賽 開發鐵人 DAY 16

技術 關鍵字疊迨泡沫萃取法/貘的資料探勘30講

上一篇說到 Text Mining 一個很重要的基礎就是能夠每天持許產生新的關鍵字, 這系統才能夠使用, 但這句話說起來說不定比唱得還要好聽, 因為雖然這是第一...

鐵人賽 開發鐵人 DAY 15

技術 文字探勘/貘的資料探勘30講

文字探勘 Text Mining 嚴格說不見得算是 Data Mining 的一支, 因為資料探勘都是在內容之外, 行為, 後設以及數字性很高的一種模型, 而文...

鐵人賽 開發鐵人 DAY 14

技術 Data Mining 軟體化的可行性/貘的資料探勘30講

許多人當一聽到說我在做 Data Mining 的時候, 第一個想到的不是說我在開發 Library, 也不是認為我在做顧問, 而是認為我在開發軟體, 但事實上...

鐵人賽 開發鐵人 DAY 13

技術 群落分析/貘的資料探勘30講

我一直說, 在傳統學術的研究, 很喜歡區分事情, 把時間作區間, 把事情作分類, 其中群落分析算是統計學中最常被提及的, 這個演算法雖然難度很高, 因為這是個...

鐵人賽 開發鐵人 DAY 12

技術 二元關係/貘的資料探勘30講

我在 2006 年寫了不少篇有關 Data Mining 的文章, 其中有一篇是有關二元關係的定義, 因為這也是關聯分析的基礎, 也舉出一些可能可以作的實例,...

鐵人賽 開發鐵人 DAY 11

技術 Data Mining 人的角色/貘的資料探勘30講

真的要做 Data Mining 說實在的也沒甚麼, 因為真的資料探勘應該是一個團隊合作的事, 而要做出這件事的話須要甚麼樣的人呢? 當然若是以一些合理的分化的...

鐵人賽 開發鐵人 DAY 10

技術 必買不可/貘的資料探勘30講

在 B 公司有了 Relation Analysis 的幾個中間表後, 有了 "人=>商品", "商品=>人&quot...

鐵人賽 開發鐵人 DAY 9

技術 關聯購買(AlsoBuy)/貘的資料探勘30講

當然說到 Data Mining 資料探勘大家都會提到 Amazon, 而在台灣就是我曾任職的 B 公司, 其中最常見到的 EC 示範就是 "尿布與啤...

鐵人賽 開發鐵人 DAY 8

技術 從降冪來降低計算量/貘的資料探勘30講

在大約了解甚麼是 Big O 後, 接下來知道資料越多的話, 演算法的 Big O 會造成計算量增加的多寡, 甚至是變成可以算或不可以算的決勝點, 當然上一篇說...

鐵人賽 開發鐵人 DAY 7

技術 Big O 在 Data Mining 的意義/貘的資料探勘30講

在演算法中, 有一個很重要的就是 Big O, 甚麼是 Big O 呢? 大家可以去查查 wiki, 我在這邊稍微解釋一下, 就是你這個演算法, 因為資料量的增...

鐵人賽 開發鐵人 DAY 6

技術 關聯分析的嘗試/貘的資料探勘30講

在繼續說成功的經驗之前, 先說失敗的經驗好了, 我有兩次有機會嘗試 Relation Analysis, 但最後並沒有真的實作出來.. 如同前面所說的, 只是把...

鐵人賽 開發鐵人 DAY 5

技術 做效率調校的基本能力有那些/貘的資料探勘30講

上一篇的重點, 就是說我們要做行為預測與輔助, 一定要在下一個行為發生前計算出足以提供參考的資訊, 當然無論就人或者是事或物, 就要看其關係的量及這兩物件的量,...

鐵人賽 開發鐵人 DAY 4

技術 從關聯分析來看效率的重點(I)/貘的資料探勘30講

本來是依我的開發時間來講我的開發實務經驗的, 但若這樣的話前四五講都是失敗經驗, 可能大家都看得不耐煩了, 因此我先跳過較早的失敗經驗, 直接講第一個成功經驗,...

鐵人賽 開發鐵人 DAY 3

技術 資料探勘 -- 資料探勘的不同點

我一直很喜歡把 Data Mining 當成是 "眾人智慧/工人智慧" 一個很不錯的典範, 因為就定義甚麼時, 會說資料探勘就是在一堆看似沒...

鐵人賽 開發鐵人 DAY 2

技術 資料探勘: 為甚麼會投入 Data Mining

我通常說, 人應該是問題要解決才會去研究的, 而我當時就是遇到想解決的問題踏入這領域的, 現在回想起來還真的相當有趣, 且我唸過的學系真的很合適做跨領域的研究資...