iT邦幫忙

DAY 1
7

資料探勘的開發, 經驗與未來系列 第 1

資料探勘 -- 前言

  • 分享至 

  • xImage
  •  

資料探勘現在已經是種顯學了, 記得在 1992 年開始投入的時候, 這門學科還是很模糊的東西, 套句我研究所老師說的一句話: 在 Computer Science 中, 還正在發展還沒發展成熟的學科, 統稱 AI (Artificial Intelligence, 人工智慧), 但我當時也並沒也去想這問題, 因為我只是想要找到問題的答案罷了.
在這將近 20 年的經驗中, 這領域花的精神與時間不亞於我對 "技術改變民主政治" 的投入, 事實上這在某方面也是一體的兩面, 畢竟若是能夠透過資料探勘知道社會大眾在想甚麼, 對 "直接民主" 也是個很大的突破, 但這樣說又扯太遠了, 畢竟資料探勘在目前是個風聲大雨點小的學科, 也就是很多人都在討論, 但實務上真的去做, 或者是說真的為大眾社會有貢獻的實例太少了, 所以雖然說是種顯學, 但大家還是知道的不多.

因此這門學科是在學術界發展的業界還要好的情型下, 造成一個很奇怪的現像: 原本是須要很多實務經驗的領域, 多是在紙上談兵, 甚至在我這 18 年的經驗中, 失敗的例子比成功的例子多很多, 當然前題要定義甚麼是成功或是失敗.

我在我的部落格中, 寫過不少篇有關 Data Mining 或 Text Mining 或 Semantic Web 的文章, 但都是零零散散沒有結構或主題, 在鐵人賽中, 與其說是為了獎品, 更重要的在這機會中激勵自己發表一直說要寫的東西, 而原本我應該寫的主題應該是 "高流量網路管理與效能調校" 應該會比較有趣, 但後來想想, 這些都是須要拿程式與範例出來看, 要我在未來 30 天中天天生出範例依我現在的工作狀況是不太可能, 所以只好放棄, 而資料探勘的文章有時重在系統分析 System Analytics 與企業智慧, Business Intelligence, 雖然這個寫出來不見得有立即可以直接參照執行, 但讓大家看看不同的觀念也是應該有所價值的, 所以最後放棄系統調校而寫資料探勘.

但事實上 Data Mining 是個跟大量資料搏鬥的一門學科, 所以跟 Performance Tuning 說完全沒有關係也不太對, 只是在這個鐵人賽中, 就主題來看就或多或少不一樣, 因此多少還是會談一些, 畢竟要生出 30 篇文章, 且大家知道我堅持每一篇是即時創作, 且具有原創性, 且一定不少於 1000 字的情型下, 說要篇篇精彩實在是種挑戰阿.

無論如何, 感謝 ITHome 給我們這群一開始沒有注意新規則的人一個敗部復活的機會, 所以, 就從今天開始吧.


下一篇
資料探勘: 為甚麼會投入 Data Mining
系列文
資料探勘的開發, 經驗與未來30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
食夢黑貘
iT邦研究生 3 級 ‧ 2010-10-12 23:34:37

希望這主題有人有興趣, 所以希望大家多多討論, 這樣我會盡所能的寫更多阿...

ilovepc iT邦研究生 5 級 ‧ 2010-11-28 13:30:41 檢舉

哈哈,您的文字深深的有力量,只是……我現在才發現,給您一個讚了!

我要留言

立即登入留言