iT邦幫忙

DAY 14
5

資料探勘的開發, 經驗與未來系列 第 14

Data Mining 軟體化的可行性/貘的資料探勘30講

許多人當一聽到說我在做 Data Mining 的時候, 第一個想到的不是說我在開發 Library, 也不是認為我在做顧問, 而是認為我在開發軟體, 但事實上要把 Data Mining 變成軟體以目前這階段來看是相當不可行的, 為甚麼呢?

  1. 如同前面所說的, 資料探勘在目前大部份的操作應用人員都不了解這是甚麼, 通常套裝軟體必須大家都知道怎用, 大家都要用的情型下, 才有可能作成軟體, 即使是給企業用的軟體, 也是大家都知道模組的功能做甚麼才有可能去組出來用, 所以才有可能寫成一個個的模組.

  2. 之前的二元關係的那篇, 大家就可以知道這是一個跟產業差別有很大差異的應用, 通常要做成軟體, 必須是大家都有的共同功能, 例如會計, 人事, 這種子系統大家都大同小異, 所以才有可能做成軟體.

  3. 因為資料探勘若是以 OLAP Online Analysis Processing 的觀點來看, 要組成一個流程的話, 就不太可能用人去操作, 所以寫成軟體一定有其輸出入, 有其 API, 但每次透過一個 API 的延遲在 Data Mining 的量累積下來是很可觀的, 所以須要有較強的聚合力才能做到, 因此說要包裝起來是不太可能的.

  4. 即使說在相同的產業或相同的應用上, 我們可以把 Library 再利用, 但還是只有這函式庫, 因為每一家公司所採用的資料庫都不一樣, 即使資料庫一樣, 資料表格都不一樣, 所以要做介接須要花時間去整合, 所以到最後真的能夠重覆利用的 Kernel 都只有一點點而已.

  5. 最後真的是欄位都一樣, 在技術上都一樣, 但資料探勘最後是人在用的, 且每一家公司的 Business Intelligence 企業智慧都不太一樣, 所以設計出來的系統邏輯及應用方面也都不太可能一樣, 因此說要包裝起來的話, 已經超過一個軟體的範籌, 而是一個經營模式了, 而要複製經營模式太難了, 因為沒有一個公司有相同的員工.

  6. 通常系統最須要觀注的是執行環境, 即是 System Requirement, 而一個資料探勘系統是個許多台機器許多系統去組合起來的大系統, 這些都須要很強的網管才能組合起來, 且並不是每家公司都有其人力以及資源去開發與應用, 到最後是個相當複雜的教育訓練, 說要成為軟體還不如說是在服務.

說了那麼多, 大家大概就知道 Data Mining 在目前階段只有可能包裝成一個服務, 但因為這系統要跟既有系統整合的地方很多, 最後說是一個委外的 Service, 還不如說是用 Consultance 會較合理, 畢竟最後的運作說是要有人操作, 經營, 維護的, 不是那種做了就可以跑的工作阿.


上一篇
群落分析/貘的資料探勘30講
下一篇
文字探勘/貘的資料探勘30講
系列文
資料探勘的開發, 經驗與未來30

1 則留言

0
食夢黑貘
iT邦研究生 3 級 ‧ 2010-10-25 23:18:14

雖然說這樣, 但大公司有自己的方法, 因為即使是所謂的軟體, 也可能只是包成一個大服務阿, 甚至 BI 也可以賣, 只是真的要把 BI 轉移或落實也不是那麼簡單..

我要留言

立即登入留言