iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
AI & Data

當自然語言處理遇上深度學習 系列

晚餐沒有頭緒?召喚一下Google Assistant馬上獲得靈感。疫情期間宅在家上Netflix追劇,平台總能掌握自己的喜好推薦新的影集。寫畢業論文卻苦於自己的菜英文,Grammarly還能幫你檢查文法和甚至建議你更道地的用詞,讓指導教授對你的文章嘖嘖稱奇。得力於蓬勃發展的深度學習演算法,自然語言處理使得我們的生活充滿便利。本系列前半部分將介紹自然語言處理的基本流程與重要技術,後半部分則著重在神經機器翻譯(neural machine translation)系統的開發實務。接下來的30天,我會按照上述脈絡整理我所學習的重點,盡量以淺顯易懂的方式呈現給大家。
  
  

鐵人鍊成 | 共 33 篇文章 | 27 人訂閱 訂閱系列文 RSS系列文
DAY 11

[常見的自然語言處理技術] 重不重要?TF-IDF 會告訴你

前言 在自然語言處理的諸多課題如信息檢索( information retrieval )和文本探勘( text mining )當中,我們希望找出重要的單詞或...

2021-09-19 ‧ 由 Friedrich1942 分享
DAY 12

[常見的自然語言處理技術] 文本相似度(I): Word Embeddings

前言 在我們每日使用的語言當中,我們經常能根據單詞所表的意義區分出同義詞與反義詞,例如英文中形容詞 thoughtful 與 attentive 、 consi...

2021-09-20 ‧ 由 Friedrich1942 分享
DAY 13

[常見的自然語言處理技術] 文本相似度(II): Cosine Similarity

前言 昨天我們使用了 Python 自然語言處理套件 spaCy 預訓練好的 word embedding model 將英文單詞轉換成為高維度的向量。今天就讓...

2021-09-21 ‧ 由 Friedrich1942 分享
DAY 14

[常見的自然語言處理技術] 文本相似度(III): Word2vec帶你深入word embeddings

前言 繼續來討論語意相似度,今天我們將深入探討如何實現 word embedding 。也就是說,我們要將單詞轉為向量(維度可自行決定),並且確保意義相仿的單詞...

2021-09-22 ‧ 由 Friedrich1942 分享
DAY 15

[常見的自然語言處理技術] 文本相似度(IV): 建立自己的Word2vec模型

前言 原本以為文本相似度這個主題兩天就可以結束了,沒想到花了四天來講。今天將會是介紹自然語言處理基礎的最後一篇,就讓我們做個客製化的 embedding mod...

2021-09-23 ‧ 由 Friedrich1942 分享
DAY 16

[深度學習回顧] How Deep Would You Learn?

前言 不知不覺,鐵人賽的賽程已經來進行了一半,每天發文使得生活過得非常充實。也感謝這裡的許多高手發表優質文章,讓第一次參賽又是跨IT領域的自己感到無比熱血。大家...

2021-09-24 ‧ 由 Friedrich1942 分享
DAY 17

[神經機器翻譯理論與實作] 這個翻譯不大正經

前言 也許你會覺得,這個標題下得很神經。沒錯!因為今天要正式進入新的主題-神經機器翻譯。我們今天將會從機器翻譯這個課題出發,綜覽在自然語言處理的發展中機器翻譯演...

2021-09-25 ‧ 由 Friedrich1942 分享
DAY 18

[神經機器翻譯理論與實作] AI也會寫故事?聊聊文本生成吧!

前言 近年來以谷歌的 Google Assistant 、蘋果的 Siri 和微軟的 Cortana 為首的聊天機器人能夠如真人一般與人類進行日常聊天,成為大家...

2021-09-26 ‧ 由 Friedrich1942 分享
DAY 19

[神經機器翻譯理論與實作] Google Translate的神奇武器- Seq2Seq (I)

前言 Google 在2016年公開宣布翻譯系統的全面改革,一改沿用多年的 Phrase-Based Statistical Machine Translati...

2021-09-27 ‧ 由 Friedrich1942 分享
DAY 20

[神經機器翻譯理論與實作] Google Translate的神奇武器- Seq2Seq (II)

前言 我們緊接著切入 RNN 為架構的編碼器-解碼器。 在seq2seq之前 RNN Encoder-Decoder 在 Google 正式提出 seq2seq...

2021-09-28 ‧ 由 Friedrich1942 分享