iT邦幫忙

nlp相關文章
共有 138 則文章
鐵人賽 AI & Data DAY 24

技術 【Day 24】自然語言處理-BOW & TF-IDF Natural Language Processing-BOW & TF-IDF

今日大綱 自然語言處理步驟 Bag of Words( BOW) TF-IDF(Term frequency-Inverse document frequen...

鐵人賽 AI & Data DAY 20

技術 【NLP】Day 20: 放點注意力在多頭上(NLP也有多頭啊!):Transformer(下)

空頭不死,多頭不止;多頭不死,空頭不止不詳 在股票市場中,人人著稱的一句話:「空頭不死,多頭不止;多頭不死,空頭不止。」意思是,如果股價在下降的趨勢時中,如...

鐵人賽 AI & Data DAY 19

技術 【NLP】Day 19: 注意!謝謝你的注意!Transformer (上)

如果我能看得更遠,那是因為站在巨人的肩膀上。牛頓 經過了前幾天的旅程,相信大家對於運用在自然語言處理的神經網路,應該已經有了一定程度的認識。神經網路是深度學...

鐵人賽 AI & Data DAY 17

技術 【NLP】Day 17: 每天成為更好的自己!神經網路也是!深度學習模型 GRU

今天沒有引言,但是有梗圖 前天的文章介紹了基本的循環神經網路RNN,但RNN的致命缺點是容易導致梯度下降或是梯度爆炸。為了要解決這個問題,必須在以下兩點...

鐵人賽 AI & Data DAY 16

技術 【NLP】Day 16: 跟你我一樣選擇性記憶的神經網路?深度學習:長短期記憶 LSTM

記憶是個很奇妙的東西。他並不如我想像中那樣運作的。我們太受限於時間了,尤其是時間的順序...《異星入境》Louise Banks 昨天我們剛介紹完循環神經網...

鐵人賽 AI & Data DAY 15

技術 【NLP】Day 15: 圓圓圈圈圓圓~深度學習:循環神經網路 RNN

對啊,這也是一種世界。也是我心中的可能性。現在的我並不只是我,還可以有很多種自我。《新世紀福音戰士》碇真嗣 循環神經網路(Recurrent Neural...

鐵人賽 Software Development DAY 14

技術 [Day 14] Pipeline Runner - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 今天會總結一下資料前處理的部分,程式碼的部分...

鐵人賽 AI & Data DAY 14

技術 【NLP】Day 14: 神經網路也會神機錯亂?不,只會精神錯亂...深度學習:前饋神經網路

在夜城,不要相信任何人,受到背叛也是自己的錯...琦薇《電馭叛客:邊緣行者》 我很喜歡賽博龐克風格的相關作品,像是銀翼殺手、攻殼機動隊,都是我很愛的作品。最...

鐵人賽 Software Development DAY 13

技術 [Day 13] NLP - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 昨天我們有提到這次的資料處理,主要包含了以下...

鐵人賽 Software Development DAY 12

技術 [Day 12] Data Pipeline - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 昨天我們有提到,從功能、應用端思考缺少哪些資...

鐵人賽 Software Development DAY 11

技術 [Day 11] 資料前處理 - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 當原始資料透過爬蟲抓下來,並存入資料庫後,一...

鐵人賽 Software Development DAY 2

技術 [Day 02] 什麼是搜尋引擎 I - 在 IT 邦尋求答案是否少了些什麼 |【搜尋引擎製作錄】

Github, Over Engineering 提到搜尋引擎,大家最直接的會想到 google。若說以一個使用者的角度而言,相信大家都用過 google,也不...

技術 【實習心得】卓騰語言科技

  因為一直以來在學校裡接收到的東西都還是學術導向居多,對於業界到底怎麼應用 NLP 技術,讓它落地,更甚至是以此獲利都不慎了解。因此六月多的時候發現卓騰在招實...

徵才 【Cinnamon AI|日商】AI Solution Specialist (NLP)

About Cinnamon AI: Cinnamon AI is the pioneer in business consulting and develo...

鐵人賽 Software Development DAY 26
Laravel 新手初見 API 系列 第 26

技術 Day26-介接 API(番外篇 I)NLP 自然語言處理之初見 Dialogflow ES

大家好~今天內容都不會寫到程式喔~市面上還有許多自然語言處理的服務,不過今天先來簡單認識一下 Dialogflow ES 吧! 前言 假如今天我們想詢問天氣如何...

技術 Semantic search BM25 COVID-19 dataset 自然語言BM25搜尋新冠文獻資料

延續上一篇( 連結 ) 做法,我們換一個資料庫,試試看NLP BM25 的搜尋功能如何。資料庫來源:COVID-19 metadata.csv downloa...

技術 語義檢索 Semantic Search NLP ( BM25 +wordcloud+LSA summary )

本文將完成: 語義檢索 從 IMDB影評檔(100則)--> 從文字欄位'IMDB_plot',找出BM25分數最高者。--> 以worldclo...

鐵人賽 自我挑戰組 DAY 2

技術 Day 15:AWS是什麼?30天從動漫/影視作品看AWS服務應用 -《雲端情人》part 2

前篇提到Samatha的運作原理與可能使用的AWS服務,今天續提她與Theodore在工作使用系統上的相似之處。某種程度上Spike Jonze是否也是在暗喻科...

鐵人賽 AI & Data DAY 8

技術 【Day 8】Adaptation!適應!讓BERT更好地過渡到下游任務!

今天開始,我們要進入一個新的主題「Adaptation」。這是指在預訓練模型和Fine-tune之間對模型額外做一個「適應」(Adaptation)的動作,讓B...

鐵人賽 AI & Data DAY 4

技術 [自然語言處理基礎] 文本預處理(I):斷開文本的鎖練

前言 上次我們提到原始文本往往夾帶大量無意義的字符,於是我們利用了正則表達式來清理資料。然而此時的文本由大量的語句所構成,各個語句中又帶有複雜的文法結構(例如倒...

鐵人賽 AI & Data DAY 6

技術 【Day 6】BERT由Transformer模型構建而成

前五天,我們講解了BERT模型的核心概念、輸入輸出以及模型的類型,現在讓我們進入模型的結構、原理部分,來談一談作為BERT模型的原始架構的Transformer...

鐵人賽 AI & Data DAY 5

技術 【Day 5】BERT家族的成員們

當本系列文章提到BERT時,最初是指Google所開發的BERT,但後續基本就是指所有運用Transformer和預訓練模式的語言模型。今天這篇文章就是在廣義的...

鐵人賽 AI & Data DAY 4

技術 【Day 4】輸出之後,BERT轉換的Embedding怎麼用?

在此之前,我們已經介紹過BERT的核心概念遷移學習Transfer Learning以及它的輸入輸出。那麼接下來的問題就是BERT將詞語轉換為包含了上下文資訊的...

鐵人賽 AI & Data DAY 2

技術 [自然語言處理基礎] Regular Expression (I): 「Ctrl + F」立馬找出關鍵字

關鍵字搜尋與自然語言處理的關聯 在正式介紹標題所提到的regular expression之前,我們先來聊聊為什麼搜尋關鍵字與自然語言處理有關。在瀏覽網頁時,我...

鐵人賽 AI & Data DAY 3

技術 【Day 3】BERT的輸出與它們的意義

BERT輸出了什麼? 回應上一篇關於詞嵌入Token Embedding的討論,BERT的輸出就是文本序列中每個詞單位的高維向量表示,你也可以把它當成一連串抽取...

鐵人賽 AI & Data DAY 2

技術 【Day 2】詞嵌入與BERT的輸入

如何從實戰層面認識BERT BERT的研究與應用可以分為不同的層次。你可以鑽研BERT的模型技術細節,瞭解它為什麼這麼有效,甚至可以發現其中有問題的設計來加以改...

鐵人賽 AI & Data DAY 1

技術 【Day 1】誰是BERT?如何BERT?BERT的基礎介紹

從芝麻街角色到改變NLP的模型 如果你用Google以「BERT」作為關鍵字搜尋圖片,那麼你會發現一個奇特的現象:一隻黃色的玩偶與奇怪的網狀結構模型混雜在一起。...

鐵人賽 AI & Data DAY 1

技術 [序章] 自然語言處理初探

前言 生活在網際網路以及智慧型手機普及的今天,與外國朋友聊天、出國旅行、與國外客戶開商務會議,縱使不熟悉當地語言,只要開啟Google Translate,語言...

技術 用 Azure Speech Studio x ChatGPT 幫你生逐字稿

用 Azure Speech Studio x ChatGPT 幫你生逐字稿 團隊草創初期,為了要拓展業務,總是需要到處跟客戶介紹自己公司的產品、服務和戰績。這...

鐵人賽 自我挑戰組 DAY 29

技術 [Python]Natural Language Toolkit

http://www.nltk.org/NLTK 是一個主流用於自然語言處理的 Python 庫 import nltk nltk.download() p...