在上上篇提到無模型預測是我認為值得寫成論文但沒寫成論文的創作, 倒是有幾個作品都被寫成論文, 倒是都不是我的, 而另一個我認為很值的寫的就是在關鍵字分析中的一項...
在演算法中, 有一個很重要的就是 Big O, 甚麼是 Big O 呢? 大家可以去查查 wiki, 我在這邊稍微解釋一下, 就是你這個演算法, 因為資料量的增...
的確大家知道 xxx 公司的 AlsoBuy 關聯購買是個成功案例, 而 CIA 的個人關鍵字的搜尋倒只是個搜尋結果的個人化, 而在之後的第二次 "遇...
話說甚麼是 Data Mining 這新名詞, 事實上在系統的觀點就是如何利用電腦與網路讓人的生活過得更好, 而用甚麼技術不是那麼重要. 某位大師說過, 人工智...
文字探勘 Text Mining 嚴格說不見得算是 Data Mining 的一支, 因為資料探勘都是在內容之外, 行為, 後設以及數字性很高的一種模型, 而文...
我一直很喜歡把 Data Mining 當成是 "眾人智慧/工人智慧" 一個很不錯的典範, 因為就定義甚麼時, 會說資料探勘就是在一堆看似沒...
在資料探勘中, 最重要的就是資料的計算與處理, 但無論說要計算前, 一定要先儲存, 且之中一定要讀取, 而這資料要做為儲存與讀取的介面就是指資料庫, 也就是說,...
我之前說過, Data Mining 若真的要說的話, 這不會比 "企業管理" 這個字的包含性更窄, 當然是不能比擬的, 但你若把 Data...
在許多 "專家" 認為, Web 3.0 將會是個 Semantic Web 技術已經成熟並應用在許多網站上的未來, 這個語意網路, 在部份...
雖說是好習慣, 但基本上還是偏執的, 也就是說並無法適用在全面性的地方, 尤其是資料探勘以外的地方, 尤其我本身不是個好的程式設計師, 所以這篇純脆只是給考慮或...
上一篇說到 Text Mining 一個很重要的基礎就是能夠每天持許產生新的關鍵字, 這系統才能夠使用, 但這句話說起來說不定比唱得還要好聽, 因為雖然這是第一...
資料探勘現在已經是種顯學了, 記得在 1992 年開始投入的時候, 這門學科還是很模糊的東西, 套句我研究所老師說的一句話: 在 Computer Scienc...
真的要做 Data Mining 說實在的也沒甚麼, 因為真的資料探勘應該是一個團隊合作的事, 而要做出這件事的話須要甚麼樣的人呢? 當然若是以一些合理的分化的...
當然說到 Data Mining 資料探勘大家都會提到 Amazon, 而在台灣就是我曾任職的 B 公司, 其中最常見到的 EC 示範就是 "尿布與啤...
記得在研究所某個老師對 "人工智慧" 下個定義, 說為甚麼會被稱為人工智慧是因為這還不成熟, 因此沒人知道這是甚麼, 在 50 年代的人工智...
高樓從平地起, 人總是站在偉人的肩膀上, 在完成曠世論文之前一定已經有許多研究成果了, 任何創意的前提是要沉浸在其環境, ..... 我們常說很多事情都是因為一...
許多人當一聽到說我在做 Data Mining 的時候, 第一個想到的不是說我在開發 Library, 也不是認為我在做顧問, 而是認為我在開發軟體, 但事實上...
我通常說, 人應該是問題要解決才會去研究的, 而我當時就是遇到想解決的問題踏入這領域的, 現在回想起來還真的相當有趣, 且我唸過的學系真的很合適做跨領域的研究資...
在繼續說成功的經驗之前, 先說失敗的經驗好了, 我有兩次有機會嘗試 Relation Analysis, 但最後並沒有真的實作出來.. 如同前面所說的, 只是把...
在身為一個企劃, 執行者, 產品經理或者是操作他的人, 當然真的要去運作或參與 Data Mining 的系統, 前提一定是要了解甚麼是資料探勘, 這樣才有可能...
我一直說, 在傳統學術的研究, 很喜歡區分事情, 把時間作區間, 把事情作分類, 其中群落分析算是統計學中最常被提及的, 這個演算法雖然難度很高, 因為這是個...
這邊的 SA 是 System Administrtor 還是 System Analysist 都是可以的, 因為一個系統分析, 必然要對系統架構與管理有點熟...
在大約了解甚麼是 Big O 後, 接下來知道資料越多的話, 演算法的 Big O 會造成計算量增加的多寡, 甚至是變成可以算或不可以算的決勝點, 當然上一篇說...
沒有一種方法或觀點可以適用所有的角度,尤其像資料探勘這種系統, 可能要更多的模型才能趨近現實. 部落格觀察有三個初始的目標, 有一個在我的定義中是用來找出部落格...
在 B 公司有了 Relation Analysis 的幾個中間表後, 有了 "人=>商品", "商品=>人"...
我在 2006 年寫了不少篇有關 Data Mining 的文章, 其中有一篇是有關二元關係的定義, 因為這也是關聯分析的基礎, 也舉出一些可能可以作的實例,...
上一篇的重點, 就是說我們要做行為預測與輔助, 一定要在下一個行為發生前計算出足以提供參考的資訊, 當然無論就人或者是事或物, 就要看其關係的量及這兩物件的量,...
在一般的統計分析中, 無論是因子分析或其他方式, 最後一定是去作分類與分群, 也就是在一定的 "Sector" 區間, 在 EC 電子商務中...
本來是依我的開發時間來講我的開發實務經驗的, 但若這樣的話前四五講都是失敗經驗, 可能大家都看得不耐煩了, 因此我先跳過較早的失敗經驗, 直接講第一個成功經驗,...
在 Data Mining 中, 通常要定義一個指數 (Index), 這個指數可能是純量 (Scale), 也可能是向量 (Vector), 但通常若是要人理...