當自然語言處理遇上深度學習

Friedrich1942 (Friedrich1942)

iT邦見習生 ‧ 點數 230

菜鳥工程師成功大學應用數學碩士班

13137

累計瀏覽數

8人

在追蹤

站內簡訊追蹤

鐵人檔案

2021 iThome 鐵人賽

回列表

AI & Data

當自然語言處理遇上深度學習系列

晚餐沒有頭緒？召喚一下Google Assistant馬上獲得靈感。疫情期間宅在家上Netflix追劇，平台總能掌握自己的喜好推薦新的影集。寫畢業論文卻苦於自己的菜英文，Grammarly還能幫你檢查文法和甚至建議你更道地的用詞，讓指導教授對你的文章嘖嘖稱奇。得力於蓬勃發展的深度學習演算法，自然語言處理使得我們的生活充滿便利。本系列前半部分將介紹自然語言處理的基本流程與重要技術，後半部分則著重在神經機器翻譯（neural machine translation）系統的開發實務。接下來的30天，我會按照上述脈絡整理我所學習的重點，盡量以淺顯易懂的方式呈現給大家。
　　
　　

鐵人鍊成｜共 33 篇文章｜ 29 人訂閱訂閱系列文 RSS系列文

0 Like 0 留言 18124 瀏覽

DAY 11

[常見的自然語言處理技術] 重不重要？TF-IDF 會告訴你

前言在自然語言處理的諸多課題如信息檢索（ information retrieval ）和文本探勘（ text mining ）當中，我們希望找出重要的單詞或...

2021-09-19 ‧ 由 Friedrich1942 分享

0 Like 0 留言 8155 瀏覽

DAY 12

[常見的自然語言處理技術] 文本相似度(I): Word Embeddings

前言在我們每日使用的語言當中，我們經常能根據單詞所表的意義區分出同義詞與反義詞，例如英文中形容詞 thoughtful 與 attentive 、 consi...

2021-09-20 ‧ 由 Friedrich1942 分享

1 Like 0 留言 27037 瀏覽

DAY 13

[常見的自然語言處理技術] 文本相似度(II): Cosine Similarity

前言昨天我們使用了 Python 自然語言處理套件 spaCy 預訓練好的 word embedding model 將英文單詞轉換成為高維度的向量。今天就讓...

2021-09-21 ‧ 由 Friedrich1942 分享

0 Like 0 留言 6594 瀏覽

DAY 14

[常見的自然語言處理技術] 文本相似度(III): Word2vec帶你深入word embeddings

前言繼續來討論語意相似度，今天我們將深入探討如何實現 word embedding 。也就是說，我們要將單詞轉為向量（維度可自行決定），並且確保意義相仿的單詞...

2021-09-22 ‧ 由 Friedrich1942 分享

0 Like 0 留言 3662 瀏覽

DAY 15

[常見的自然語言處理技術] 文本相似度(IV): 建立自己的Word2vec模型

前言原本以為文本相似度這個主題兩天就可以結束了，沒想到花了四天來講。今天將會是介紹自然語言處理基礎的最後一篇，就讓我們做個客製化的 embedding mod...

2021-09-23 ‧ 由 Friedrich1942 分享

0 Like 1 留言 5088 瀏覽

DAY 16

[深度學習回顧] How Deep Would You Learn?

前言不知不覺，鐵人賽的賽程已經來進行了一半，每天發文使得生活過得非常充實。也感謝這裡的許多高手發表優質文章，讓第一次參賽又是跨IT領域的自己感到無比熱血。大家...

2021-09-24 ‧ 由 Friedrich1942 分享

1 Like 0 留言 4025 瀏覽

DAY 17

[神經機器翻譯理論與實作] 這個翻譯不大正經

前言也許你會覺得，這個標題下得很神經。沒錯！因為今天要正式進入新的主題－神經機器翻譯。我們今天將會從機器翻譯這個課題出發，綜覽在自然語言處理的發展中機器翻譯演...

2021-09-25 ‧ 由 Friedrich1942 分享

0 Like 0 留言 3842 瀏覽

DAY 18

[神經機器翻譯理論與實作] AI也會寫故事？聊聊文本生成吧！

前言近年來以谷歌的 Google Assistant 、蘋果的 Siri 和微軟的 Cortana 為首的聊天機器人能夠如真人一般與人類進行日常聊天，成為大家...

2021-09-26 ‧ 由 Friedrich1942 分享

0 Like 0 留言 7018 瀏覽

DAY 19

[神經機器翻譯理論與實作] Google Translate的神奇武器- Seq2Seq (I)

前言 Google 在2016年公開宣布翻譯系統的全面改革，一改沿用多年的 Phrase-Based Statistical Machine Translati...

2021-09-27 ‧ 由 Friedrich1942 分享

0 Like 0 留言 2769 瀏覽

DAY 20

[神經機器翻譯理論與實作] Google Translate的神奇武器- Seq2Seq (II)

前言我們緊接著切入 RNN 為架構的編碼器-解碼器。在seq2seq之前 RNN Encoder-Decoder 在 Google 正式提出 seq2seq...

2021-09-28 ‧ 由 Friedrich1942 分享

Friedrich1942的鐵人檔案

Friedrich1942的收藏

Friedrich1942的追蹤

Friedrich1942的Like

Friedrich1942的紀錄

Friedrich1942的訂閱列表

鐵人檔案

當自然語言處理遇上深度學習 系列

標記使用者

當自然語言處理遇上深度學習系列