第十三屆 優選

ai-and-data
當自然語言處理遇上深度學習
Friedrich1942

系列文章

DAY 11

[常見的自然語言處理技術] 重不重要?TF-IDF 會告訴你

前言 在自然語言處理的諸多課題如信息檢索( information retrieval )和文本探勘( text mining )當中,我們希望找出重要的單詞或...

DAY 12

[常見的自然語言處理技術] 文本相似度(I): Word Embeddings

前言 在我們每日使用的語言當中,我們經常能根據單詞所表的意義區分出同義詞與反義詞,例如英文中形容詞 thoughtful 與 attentive 、 consi...

DAY 13

[常見的自然語言處理技術] 文本相似度(II): Cosine Similarity

前言 昨天我們使用了 Python 自然語言處理套件 spaCy 預訓練好的 word embedding model 將英文單詞轉換成為高維度的向量。今天就讓...

DAY 14

[常見的自然語言處理技術] 文本相似度(III): Word2vec帶你深入word embeddings

前言 繼續來討論語意相似度,今天我們將深入探討如何實現 word embedding 。也就是說,我們要將單詞轉為向量(維度可自行決定),並且確保意義相仿的單詞...

DAY 15

[常見的自然語言處理技術] 文本相似度(IV): 建立自己的Word2vec模型

前言 原本以為文本相似度這個主題兩天就可以結束了,沒想到花了四天來講。今天將會是介紹自然語言處理基礎的最後一篇,就讓我們做個客製化的 embedding mod...

DAY 16

[深度學習回顧] How Deep Would You Learn?

前言 不知不覺,鐵人賽的賽程已經來進行了一半,每天發文使得生活過得非常充實。也感謝這裡的許多高手發表優質文章,讓第一次參賽又是跨IT領域的自己感到無比熱血。大家...

DAY 17

[神經機器翻譯理論與實作] 這個翻譯不大正經

前言 也許你會覺得,這個標題下得很神經。沒錯!因為今天要正式進入新的主題-神經機器翻譯。我們今天將會從機器翻譯這個課題出發,綜覽在自然語言處理的發展中機器翻譯演...

DAY 18

[神經機器翻譯理論與實作] AI也會寫故事?聊聊文本生成吧!

前言 近年來以谷歌的 Google Assistant 、蘋果的 Siri 和微軟的 Cortana 為首的聊天機器人能夠如真人一般與人類進行日常聊天,成為大家...

DAY 19

[神經機器翻譯理論與實作] Google Translate的神奇武器- Seq2Seq (I)

前言 Google 在2016年公開宣布翻譯系統的全面改革,一改沿用多年的 Phrase-Based Statistical Machine Translati...

DAY 20

[神經機器翻譯理論與實作] Google Translate的神奇武器- Seq2Seq (II)

前言 我們緊接著切入 RNN 為架構的編碼器-解碼器。 在seq2seq之前 RNN Encoder-Decoder 在 Google 正式提出 seq2seq...