iT邦幫忙

nlp相關文章
共有 95 則文章

技術 【實習心得】卓騰語言科技

  因為一直以來在學校裡接收到的東西都還是學術導向居多,對於業界到底怎麼應用 NLP 技術,讓它落地,更甚至是以此獲利都不慎了解。因此六月多的時候發現卓騰在招實...

鐵人賽 AI & Data DAY 29

技術 [DAY29] 機器學習 - 自然語言NLP(二)

主題建模 確定它分析的每個文本或文檔中的主題 從整體文本數據推斷主題集群 將包含類似主題集群的文本或文檔組合在一起 文本聚合 將包含相似主題的文字或文件組...

鐵人賽 自我挑戰組 DAY 10

技術 Day 10 - 使用 Transformers (1)

在 Day5 的時候我們有提到 Hugging Face 的 Transformers 函式庫的一點介紹和例子,那這章會在深入它的相關使用和比較詳細的介紹。(裡...

鐵人賽 自我挑戰組 DAY 9

技術 Day 9 - Transformer模型 -- 架構篇(3)

以上圖出自李謦伊 今天我們要細講 Transformer 模型架構的 Decoder(解碼器) 的部分,也就是圖中的右半部,這邊會說明它跟 Encoder 的...

鐵人賽 自我挑戰組 DAY 8

技術 Day 8 - Transformer模型 -- 架構篇(2)

今天我們要細講 Transformer 模型架構的 Encoder(編碼器) 的部分,也就是圖中的左半部,那我們就一一剖析裡面的每一層在做哪些事情 以上圖出自...

鐵人賽 自我挑戰組 DAY 7

技術 Day 7 - Transformer模型 -- 架構篇(1)

Transformer 模型架構主要由兩個區塊組成,左側是 Encoder(編碼器),右側是 Decoder(解碼器) (這邊先簡單說明,下一章節回詳細解析兩...

鐵人賽 自我挑戰組 DAY 6

技術 Day 6 - NLP常用的Transformer模型 -- 簡介篇

"Transformer模型" 是一種深度學習架構,最初由Google於2017年提出。它是一種用於處理序列數據的神經網絡架構,特別在自然語...

鐵人賽 自我挑戰組 DAY 5

技術 Day 5 - 開源機器學習社群平台-Hugging Face

Hugging Face 是甚麼 Hugging Face 是一家軟體公司和開源社區,專注於自然語言處理和人工智慧領域的研究和開發。該社區成立於2016年,以其...

鐵人賽 AI & Data DAY 5

技術 【Day5】淺談NLP-自然語言處理

自然語言處理(Natural Language Processing, NLP),是人工智慧的一個重要分支,跨足人工智慧和語言學領域的學科。主要目標是讓電腦(機...

鐵人賽 自我挑戰組 DAY 4

技術 Day 4 - NLP 相關開發環境與設定

這裡介紹的開發環境都是我自己有試過的。 由於是要訓練自然語言處理的模型,這會蠻耗時的,因此如果電腦有GPU是最好的,如果沒有的話沒關係大家可以使用我等等介紹的雲...

鐵人賽 AI & Data DAY 2

技術 AIGC、Gen AI 生成式介紹

那今天就先從AIGCA.I. generate content AI生成內容開始介紹有時候可能會看到Generate AI 簡寫Gen AI 都是指生成式AI...

鐵人賽 自我挑戰組 DAY 2

技術 Day 2 - NLP (自然語言處理)是什麼?

讓機器、電腦擁有理解人類說話的語言的能力,就是自然語言處理,它能夠以自然語言文字或語音來查詢資料。這也稱為「語言輸入」。以一個簡單的例子讓大家可以比較理解,例如...

鐵人賽 AI & Data DAY 1
LLM 學習筆記 系列 第 1

技術 LLM Note Day 1 - 語言模型簡介

前言 語言模型在 NLP 領域裡面,長期以來一直是個倍受重視的主題。拜 ChatGPT 所賜,這半年多以來大型語言模型的相關議題迅速爆紅,其影響力相信大家都感同...

鐵人賽 自我挑戰組 DAY 1

技術 Day 1 - 30天從零開始學習NLP_內容簡介

一、內容簡介 這次的鐵人賽主要是要是將之前實習時所做的事和學的內容做一個整理,以及做一些延伸。 最主要呢著重介紹 NLP(自然語言處理) 的子領域 NER -...

達標好文 技術 GPT-4 發佈,ChatGPT又進化了

前言 ChatGPT在今天(2023/3/14)推出新一代模型GPT-4,距離上一代GPT-3.5模型才事隔四個月,原本專家預估明年才會release,沒想到提...

技術 NLP (自然語言處理)攻略 - Intent Classification

任務簡介 意圖分析, 表示 ⇒ 輸入文字敘述, 要分類文字屬於何種意圖 sample: "i dont like my current insuran...

技術 用 Azure Speech Studio x ChatGPT 幫你生逐字稿

用 Azure Speech Studio x ChatGPT 幫你生逐字稿 團隊草創初期,為了要拓展業務,總是需要到處跟客戶介紹自己公司的產品、服務和戰績。這...

達標好文 技術 當魔法成為現實 - ChatGPT 的詠唱咒文

前言 ChatGPT 的出現在全球引起一股宣然大波,也讓筆者最近每天都廢寢忘食的跟他聊天,通勤的路上也不斷跟 ChatGPT 探索他無窮無盡的知識,是個非常有趣...

技術 PTT 爬蟲

前言 良葛格過世的消息對我來說十分衝擊,筆者從國中開始學 C 語言,就是一路看良哥的筆記長大,乃至於後來學的 Java, Python 以及很多軟體設計的思維都...

鐵人賽 AI & Data DAY 24

技術 【Day 24】自然語言處理-BOW & TF-IDF Natural Language Processing-BOW & TF-IDF

今日大綱 自然語言處理步驟 Bag of Words( BOW) TF-IDF(Term frequency-Inverse document frequen...

鐵人賽 AI & Data DAY 20

技術 【NLP】Day 20: 放點注意力在多頭上(NLP也有多頭啊!):Transformer(下)

空頭不死,多頭不止;多頭不死,空頭不止不詳 在股票市場中,人人著稱的一句話:「空頭不死,多頭不止;多頭不死,空頭不止。」意思是,如果股價在下降的趨勢時中,如...

鐵人賽 AI & Data DAY 19

技術 【NLP】Day 19: 注意!謝謝你的注意!Transformer (上)

如果我能看得更遠,那是因為站在巨人的肩膀上。牛頓 經過了前幾天的旅程,相信大家對於運用在自然語言處理的神經網路,應該已經有了一定程度的認識。神經網路是深度學...

鐵人賽 AI & Data DAY 17

技術 【NLP】Day 17: 每天成為更好的自己!神經網路也是!深度學習模型 GRU

今天沒有引言,但是有梗圖 前天的文章介紹了基本的循環神經網路RNN,但RNN的致命缺點是容易導致梯度下降或是梯度爆炸。為了要解決這個問題,必須在以下兩點...

鐵人賽 AI & Data DAY 16

技術 【NLP】Day 16: 跟你我一樣選擇性記憶的神經網路?深度學習:長短期記憶 LSTM

記憶是個很奇妙的東西。他並不如我想像中那樣運作的。我們太受限於時間了,尤其是時間的順序...《異星入境》Louise Banks 昨天我們剛介紹完循環神經網...

鐵人賽 AI & Data DAY 15

技術 【NLP】Day 15: 圓圓圈圈圓圓~深度學習:循環神經網路 RNN

對啊,這也是一種世界。也是我心中的可能性。現在的我並不只是我,還可以有很多種自我。《新世紀福音戰士》碇真嗣 循環神經網路(Recurrent Neural...

鐵人賽 Software Development DAY 14

技術 [Day 14] Pipeline Runner - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 今天會總結一下資料前處理的部分,程式碼的部分...

鐵人賽 AI & Data DAY 14

技術 【NLP】Day 14: 神經網路也會神機錯亂?不,只會精神錯亂...深度學習:前饋神經網路

在夜城,不要相信任何人,受到背叛也是自己的錯...琦薇《電馭叛客:邊緣行者》 我很喜歡賽博龐克風格的相關作品,像是銀翼殺手、攻殼機動隊,都是我很愛的作品。最...

鐵人賽 Software Development DAY 13

技術 [Day 13] NLP - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 昨天我們有提到這次的資料處理,主要包含了以下...

鐵人賽 Software Development DAY 12

技術 [Day 12] Data Pipeline - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 昨天我們有提到,從功能、應用端思考缺少哪些資...

鐵人賽 Software Development DAY 11

技術 [Day 11] 資料前處理 - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 當原始資料透過爬蟲抓下來,並存入資料庫後,一...