iT邦幫忙

nlp相關文章
共有 95 則文章
鐵人賽 自我挑戰組 DAY 29

技術 [Python]Natural Language Toolkit

http://www.nltk.org/NLTK 是一個主流用於自然語言處理的 Python 庫 import nltk nltk.download() p...

鐵人賽 自我挑戰組 DAY 23

技術 [Python][OpenCV]如何利用Tesserect OCR做辨識

https://zh.wikipedia.org/wiki/Tesseracthttps://help.ubuntu.com/community/OCR imp...

鐵人賽 AI & Data DAY 20

技術 【NLP】Day 20: 放點注意力在多頭上(NLP也有多頭啊!):Transformer(下)

空頭不死,多頭不止;多頭不死,空頭不止不詳 在股票市場中,人人著稱的一句話:「空頭不死,多頭不止;多頭不死,空頭不止。」意思是,如果股價在下降的趨勢時中,如...

鐵人賽 Software Development DAY 12

技術 [Day 12] Data Pipeline - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 昨天我們有提到,從功能、應用端思考缺少哪些資...

鐵人賽 Software Development DAY 11

技術 [Day 11] 資料前處理 - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 當原始資料透過爬蟲抓下來,並存入資料庫後,一...

鐵人賽 AI & Data DAY 3

技術 [Day3] 知名企業使用Dialogflow的案例

Dialogflow 官方列出的三大案例分享,分別是KLM航空,達美樂和Ticketmaster,這三間公司都是跨國企業,擁有相當龐大的產品客戶。 三種案例也分...

技術 如何在亞馬遜上數據採集並找到最暢銷的產品

毫無疑問,為了在亞馬遜上獲得可觀的利潤,選擇最佳的銷售產品至關重要。為了找出哪種產品賣得最好,我們需要進行產品研究以了解市場。在本文中,我將討論5個技巧,這些技...

鐵人賽 AI & Data DAY 30

達標好文 技術 Day 30: 總結、心得與展望

總結與心得 本來想分兩個段落來寫總結和心得,只是寫著寫著發現,這兩個段落相輔相成。這次我的主題是關於我個人非常喜歡的自然語言處理,儘管內容沒有太多涉入當今的st...

鐵人賽 AI & Data DAY 14

技術 【NLP】Day 14: 神經網路也會神機錯亂?不,只會精神錯亂...深度學習:前饋神經網路

在夜城,不要相信任何人,受到背叛也是自己的錯...琦薇《電馭叛客:邊緣行者》 我很喜歡賽博龐克風格的相關作品,像是銀翼殺手、攻殼機動隊,都是我很愛的作品。最...

鐵人賽 Software Development DAY 14

技術 [Day 14] Pipeline Runner - 果然我的自然語言處理搞錯了。|【搜尋引擎製作錄】

Github, Over Engineering 礙於篇幅緣故,過多細節的部分,會挑重點講述,如有疑問歡迎留言討論 今天會總結一下資料前處理的部分,程式碼的部分...

鐵人賽 AI & Data DAY 27

技術 Day 27: 猜字AI加強版 -- Bigram Guesser

除了考慮字母出現的機率和在各種長度中各個字母出現的機率,今天我們也把字母的排列順序列入考量。例如,我們看到一個字 m _ s s,我們知道他有很高的機率會是母音...

鐵人賽 Software Development DAY 26
Laravel 新手初見 API 系列 第 26

技術 Day26-介接 API(番外篇 I)NLP 自然語言處理之初見 Dialogflow ES

大家好~今天內容都不會寫到程式喔~市面上還有許多自然語言處理的服務,不過今天先來簡單認識一下 Dialogflow ES 吧! 前言 假如今天我們想詢問天氣如何...

鐵人賽 AI & Data DAY 25

技術 Day 25: 三種AI猜字方法

第一種猜字方法:隨機猜字 為了設下一個基準,我們先設計一種AI方法--每次從26個字母中隨機選取一個字母來猜。這裡我先將26個字母存到 list 中,再用 nu...

鐵人賽 自我挑戰組 DAY 24

技術 [Python][OpenCV]如何利用Tesserect OCR做翻譯器

借用google的翻譯功能 from googletrans import Translator 主模組參數設定 class tesserectOCR():...

技術 NLP (自然語言處理)攻略 - Intent Classification

任務簡介 意圖分析, 表示 ⇒ 輸入文字敘述, 要分類文字屬於何種意圖 sample: "i dont like my current insuran...

鐵人賽 AI & Data DAY 19

技術 【NLP】Day 19: 注意!謝謝你的注意!Transformer (上)

如果我能看得更遠,那是因為站在巨人的肩膀上。牛頓 經過了前幾天的旅程,相信大家對於運用在自然語言處理的神經網路,應該已經有了一定程度的認識。神經網路是深度學...

鐵人賽 AI & Data DAY 16

技術 【NLP】Day 16: 跟你我一樣選擇性記憶的神經網路?深度學習:長短期記憶 LSTM

記憶是個很奇妙的東西。他並不如我想像中那樣運作的。我們太受限於時間了,尤其是時間的順序...《異星入境》Louise Banks 昨天我們剛介紹完循環神經網...

鐵人賽 AI & Data DAY 24

技術 【Day 24】自然語言處理-BOW & TF-IDF Natural Language Processing-BOW & TF-IDF

今日大綱 自然語言處理步驟 Bag of Words( BOW) TF-IDF(Term frequency-Inverse document frequen...

鐵人賽 AI & Data DAY 15

技術 【NLP】Day 15: 圓圓圈圈圓圓~深度學習:循環神經網路 RNN

對啊,這也是一種世界。也是我心中的可能性。現在的我並不只是我,還可以有很多種自我。《新世紀福音戰士》碇真嗣 循環神經網路(Recurrent Neural...

鐵人賽 自我挑戰組 DAY 2

技術 Day 15:AWS是什麼?30天從動漫/影視作品看AWS服務應用 -《雲端情人》part 2

前篇提到Samatha的運作原理與可能使用的AWS服務,今天續提她與Theodore在工作使用系統上的相似之處。某種程度上Spike Jonze是否也是在暗喻科...

技術 【實習心得】卓騰語言科技

  因為一直以來在學校裡接收到的東西都還是學術導向居多,對於業界到底怎麼應用 NLP 技術,讓它落地,更甚至是以此獲利都不慎了解。因此六月多的時候發現卓騰在招實...

鐵人賽 AI & Data DAY 17

技術 【NLP】Day 17: 每天成為更好的自己!神經網路也是!深度學習模型 GRU

今天沒有引言,但是有梗圖 前天的文章介紹了基本的循環神經網路RNN,但RNN的致命缺點是容易導致梯度下降或是梯度爆炸。為了要解決這個問題,必須在以下兩點...

鐵人賽 AI & Data DAY 2

技術 AIGC、Gen AI 生成式介紹

那今天就先從AIGCA.I. generate content AI生成內容開始介紹有時候可能會看到Generate AI 簡寫Gen AI 都是指生成式AI...

鐵人賽 自我挑戰組 DAY 6

技術 Day 6 - NLP常用的Transformer模型 -- 簡介篇

"Transformer模型" 是一種深度學習架構,最初由Google於2017年提出。它是一種用於處理序列數據的神經網絡架構,特別在自然語...

技術 Semantic search BM25 COVID-19 dataset 自然語言BM25搜尋新冠文獻資料

延續上一篇( 連結 ) 做法,我們換一個資料庫,試試看NLP BM25 的搜尋功能如何。資料庫來源:COVID-19 metadata.csv downloa...

鐵人賽 自我挑戰組 DAY 7

技術 Day 7 - Transformer模型 -- 架構篇(1)

Transformer 模型架構主要由兩個區塊組成,左側是 Encoder(編碼器),右側是 Decoder(解碼器) (這邊先簡單說明,下一章節回詳細解析兩...

鐵人賽 自我挑戰組 DAY 9

技術 Day 9 - Transformer模型 -- 架構篇(3)

以上圖出自李謦伊 今天我們要細講 Transformer 模型架構的 Decoder(解碼器) 的部分,也就是圖中的右半部,這邊會說明它跟 Encoder 的...

鐵人賽 自我挑戰組 DAY 8

技術 Day 8 - Transformer模型 -- 架構篇(2)

今天我們要細講 Transformer 模型架構的 Encoder(編碼器) 的部分,也就是圖中的左半部,那我們就一一剖析裡面的每一層在做哪些事情 以上圖出自...

鐵人賽 AI & Data DAY 29

技術 [DAY29] 機器學習 - 自然語言NLP(二)

主題建模 確定它分析的每個文本或文檔中的主題 從整體文本數據推斷主題集群 將包含類似主題集群的文本或文檔組合在一起 文本聚合 將包含相似主題的文字或文件組...

鐵人賽 自我挑戰組 DAY 5

技術 Day 5 - 開源機器學習社群平台-Hugging Face

Hugging Face 是甚麼 Hugging Face 是一家軟體公司和開源社區,專注於自然語言處理和人工智慧領域的研究和開發。該社區成立於2016年,以其...