iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 30
10

總結與心得

本來想分兩個段落來寫總結和心得,只是寫著寫著發現,這兩個段落相輔相成。這次我的主題是關於我個人非常喜歡的自然語言處理,儘管內容沒有太多涉入當今的state-of-the-art,但是這三十天總是秉持著一個目標:深入淺出、讓內容有趣。

前面的二十九天中,我花了九天的時間介紹了幾個自然語言處理的課題、十二天的時間稍微深入地講述了搜尋引擎技術和資訊檢索、五天的時間說明且實作了語言模型、利用最後兩天的時間簡介了文字相似度。我很喜歡數據化,所以也做了一點統計:

https://ithelp.ithome.com.tw/upload/images/20191001/20118683lS0Om8z4ND.png

二十九天中總共,不含code總共寫下來19185個字,平均每篇約662個字,還算是達到我個人的要求;我也統計了我放了幾張圖片在文章中,因為我認為一篇圖文並茂的文章更有機會讓人讀來津津有味;另外,在三十天的文章中,有1/3的文章是關於我們介紹的任務的實作。有些實作的目標是盼望讓大家覺得更有趣(例如:猜字遊戲的實作以及逐步改進猜字AI的過程、簡易語音翻譯機等),有些則是希望能夠讓大家更清楚所介紹的課題的流程(搜尋引擎的實作就是為了這個目標)。

三十天寫作的過程中,我也是一邊反思些我文章的問題,像是:

  • 寫中文技術社群的文章,卻沒有講到對中文字的處理法。在最開頭我就這麼設定了,會這麼設定是跟我的NLP學習之路有關。我所熟悉、所應用和研究的方向都是在處理英文這個語言,對於中文字的處理我還沒有太多把握,所以沒有貿然宣告我能夠用將中文也處理好。
  • 每寫完一篇文章,我都會想想這篇的難易度如何。有些地方怕講得太深入,有些地方反而該講詳細而沒有。難易度的掌控是需要持續學習的。

再來關於「鐵人賽」,我必須說,不愧是鐵人賽啊!過去曾和常參加鐵人三項的朋友聊到長跑心得,他跟我說,對於剛開始跑步的朋友,最難熬的通常是完賽前的最後三分之一路程。體力將要見底、耐力也快達到極點、剩下的就是意志力的搏鬥,是自己和自己的戰爭。鐵人三項比的是游泳、腳踏車和短程馬拉松,但我心目中的三項其實是體力、技術力和意志力,三者缺一不可。

套用到IT邦的鐵人賽也是如此,三十天需要夠充實、有足夠的內容可以分享、同時在根本上最難的就是意志力。我的草稿在七月份,我的短假期中完成。說是假期,每天早上起床我的頭一件事就是先花三個多小時邊吃早餐邊寫下兩篇文章的草稿,每天晚上又再花些時間整理明天要寫的資料或寫一點Jupyter Notebook上的code,這真是一段非常充實的時光。在「寫得好累」和「不想放棄」之間徘徊,這也是意志力的考驗。

未來展望

我現在主要研究的方向是主題模型Topic Model。接下來或許可以用文章的方式來介紹些這個領域中的技術和發展過程及方向,又或許可以把文章搜集起來,準備再次挑戰明年的鐵人賽(?

希望這些文章對大家有幫助,我們下次再會!


上一篇
Day 29: 電腦怎麼知道「說」跟「曰」意義相近?關於文字相似度
系列文
深入淺出搜尋引擎和自然語言處理30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中
1
海綿寶寶
iT邦大神 1 級 ‧ 2019-10-01 08:59:49

恭喜完賽
/images/emoticon/emoticon42.gif/images/emoticon/emoticon42.gif/images/emoticon/emoticon42.gif

雖然我不能全部理解您學問的精妙之處
但是我謹以iT邦幫忙邦友身分
謝謝您拉高了鐵人賽文章的平均水準

每天早上起床我的頭一件事就是先花三個多小時邊吃早餐邊寫下兩篇文章的草稿

如果是我的話
應該會花三個小時在吃早餐
只有多的那一部份在寫草稿
/images/emoticon/emoticon71.gif

謝謝你海綿寶寶
也謝謝你長期在IT邦幫忙幫助邦友們解決問題以及邀請各領域的高手回答問題
那段時間剛好有假回台灣
可以直接買早餐店早餐的台灣真的太棒了哈哈哈
吃著台灣的早餐想著台灣的IT社群
自然產生了動力(?

1
floro615
iT邦新手 5 級 ‧ 2019-10-01 19:02:30

辛苦了!恭喜完賽!
雖然不是整個系列的文章我都能夠跟得上,但看得出這系列的文章有相當的品質和深度,謝謝丹尼爾胡

謝謝你floro615
謝謝你這一個月來的追蹤,你們是我完成這次鐵人賽的動力之一!

3
chifuh99
iT邦新手 5 級 ‧ 2019-10-02 07:01:38

恭喜完賽

每寫完一篇文章,我都會想想這篇的難易度如何。有些地方怕講得太深入,有些地方反而該講詳細而沒有。難易度的掌控是需要持續學習的。

這系列的鐵人賽寫得很不錯
針對自然語言處理的議題都有點到
並且點到為止

謝謝你帶IT邦幫忙的邦友們認識NLP
也期待你未來寫出關於Topic Model的文章
繼續帶來貢獻

0
阿展展展
iT邦好手 1 級 ‧ 2020-02-21 20:15:03

好厲害!!

我要留言

立即登入留言