我通常說, 人應該是問題要解決才會去研究的, 而我當時就是遇到想解決的問題踏入這領域的, 現在回想起來還真的相當有趣, 且我唸過的學系真的很合適做跨領域的研究資料探勘這件事.
當然在當時並沒有資料探勘這名詞, 更沒想過這個以後會成為一門學科, 我只是想要透過這樣的開發來讓生活過得更好罷了, 但現在這個仔細想想, 任何技術的開發, 不都是因為須求來產生嗎?
當時為甚麼會研究這個題目的原因有兩件事情:
記得當時是 Internet 剛起來的時候, 在 1992 年時, 我開始接觸 Use-Net, 也就是 Network News Transfer Protocol (NNTP) 所架購出來的 Newsgroup (新聞群組), 在當時是 Internet 最主要的討論串的地方, 而在當時, 可以說是幾乎有心人都可以創造一個新的新聞群組, 畢竟 NNTP 是開放且幾乎沒有 Root 的地方, 只是跟你轉信的站多寡罷了, 因此 Newsgroup 充滿的各式各樣的資訊, 幾乎每天都有新的討論群組產生, 更不要說是有成千上萬的文章了...
只是要人去看這些群組或成千上萬篇文章跟本不太可能, 所以當時就想說, 若能做出一個代理人, 能夠從這成千上萬的文章中, 每天找到對你個人而言最精彩不能錯過的文章十篇就好了, 而當時並沒有想到這是相當困難作到的, 就把這當作目標了.
當然還有一個問題更加深我決定投入 Data Mining 的原因.
我自己承認我的興趣嗜好在某方面是有種偏執, 我一直想透過網路找到跟我有一樣偏執的興趣與嗜好, 但在之前, 還沒想到用資料探勘的方式去完成, 而想到的是一個類似 SNS (Social Network System) 加上 IM (Instant Message) 或 Status Presentation (狀態呈現) 的一個整合架構, ..
我一直認為, 人與人之間因為城市的冷漠會越來越梳離, 而網路資訊應該接下把人拉緊連繫的角色, 而一直在 1995 年我慢慢確立該如何去完成這個系統, 但發現以當時的 Computing Power 是不太可能的, 但我當時深信是可以完成, 而讓我們不像是 Blind Date 那樣的認識人, 應該是以興趣嗜好作出發, 不該只是男女性別而已.
當然這兩個題目現在或多或少都已經完成或實作過, 這個後面幾篇就會講到了.
事實上這話題已經講過很多次, 這次寫的蠻沒力的, 希望以後可以補述...
有機會有機會。
沒力是因為沒人回應嗎?(攤手)