自然語言處理(NLP)的目標是設計演算法來讓電腦「理解」自然語言以執行一些任務,依難易度舉例如下: 簡單 拼寫檢查(Spell Checking) 關鍵字搜...
前言 ChatGPT 的出現在全球引起一股宣然大波,也讓筆者最近每天都廢寢忘食的跟他聊天,通勤的路上也不斷跟 ChatGPT 探索他無窮無盡的知識,是個非常有趣...
從芝麻街角色到改變NLP的模型 如果你用Google以「BERT」作為關鍵字搜尋圖片,那麼你會發現一個奇特的現象:一隻黃色的玩偶與奇怪的網狀結構模型混雜在一起。...
About Cinnamon AI: Cinnamon AI is the pioneer in business consulting and develo...
鐵人賽第三十篇,想帶大家來探討聊天機器人(Chatbot)這塊的發展。 圖片來源:https://chatbotsmagazine.com/why-the-...
明明整個網路中有成千上萬的資料,為什麼Google能在一秒內告訴我答案?搜尋引擎以及各網站的搜尋功能到底是怎麼運作的?為什麼我在搜尋列輸入一大串字之後,搜尋引擎...
如何從實戰層面認識BERT BERT的研究與應用可以分為不同的層次。你可以鑽研BERT的模型技術細節,瞭解它為什麼這麼有效,甚至可以發現其中有問題的設計來加以改...
Recurrent Neural Network(RNN)是神經網絡的一種,常應用在處理時間、空間序列上有強關聯的訊息,尤其在 NLP (Natural Lan...
https://pypi.org/project/SpeechRecognition/ pip3 install SpeechRecognition Coll...
提醒: 本篇文章的code在這裡 概述 所謂自然語言處理,就是希望可以讓電腦讀懂人類的文字。不過,這篇文章只會處理已經存成文字檔的文字,暫時不會提到手寫文字辨識...
在搜尋技術中TF-IDF是個很基礎而重要的統計方式。什麼是TF-IDF呢?而又為什麼需要TF-IDF? TF-IDF的全名是Term Frequency - I...
昨天的文中我們說到詞性標註,今天讓我們透過NLP界經典的Python Library-NLTK,親手讓電腦幫我們標注文中的詞性。如系列簡介所說,在這30天中,我...
語言是由文字組合出來的。作為一個人類,我們能夠將一篇文章分割成好幾個部分來閱讀和理解,為了讓電腦理解一篇文章,它也必須能夠這麼做。 第一步就在於文字的預處理和正...
BERT輸出了什麼? 回應上一篇關於詞嵌入Token Embedding的討論,BERT的輸出就是文本序列中每個詞單位的高維向量表示,你也可以把它當成一連串抽取...
用 Azure Speech Studio x ChatGPT 幫你生逐字稿 團隊草創初期,為了要拓展業務,總是需要到處跟客戶介紹自己公司的產品、服務和戰績。這...
前五天,我們講解了BERT模型的核心概念、輸入輸出以及模型的類型,現在讓我們進入模型的結構、原理部分,來談一談作為BERT模型的原始架構的Transformer...
昨天說到語言模型,今天要來介紹另一個模型--主題模型(Topic Model)。主題模型能夠幫助人們短時間理解原本幾乎不可能讀得完的大型非結構化的文集,例如科學...
還記得第一次使用手機上的「Hey, Siri」或是「Ok, Google」功能時的自己有多興奮嗎?在接下來幾天的文中,我會講解昨天提到的幾個自然語言處理主要課題...
在此之前,我們已經介紹過BERT的核心概念遷移學習Transfer Learning以及它的輸入輸出。那麼接下來的問題就是BERT將詞語轉換為包含了上下文資訊的...
什麼是資訊檢索呢?大家最清楚的例子莫過於網路搜尋引擎了。當你在Google Search上輸入一段你想查詢的字,作為一個使用者通常會跟搜尋引擎有以下的互動: (...
今天介紹NLP常見任務的第三項:自然語言生成(Natural Language Generation) 自然語言處理的一大目標是要讓電腦讀懂人類在說什麼,就如同...
前言 上次我們提到原始文本往往夾帶大量無意義的字符,於是我們利用了正則表達式來清理資料。然而此時的文本由大量的語句所構成,各個語句中又帶有複雜的文法結構(例如倒...
最近在研究NLP的東西,我覺得這東西很好,也希望家人能看看,所以在翻過幾本書後找到這個我覺得比較簡單又實用入門的書,重點是裡頭是三格漫畫的方式,看起來很輕鬆,也...
前言 ChatGPT在今天(2023/3/14)推出新一代模型GPT-4,距離上一代GPT-3.5模型才事隔四個月,原本專家預估明年才會release,沒想到提...
前言 生活在網際網路以及智慧型手機普及的今天,與外國朋友聊天、出國旅行、與國外客戶開商務會議,縱使不熟悉當地語言,只要開啟Google Translate,語言...
前言 語言模型在 NLP 領域裡面,長期以來一直是個倍受重視的主題。拜 ChatGPT 所賜,這半年多以來大型語言模型的相關議題迅速爆紅,其影響力相信大家都感同...
[DAY24] 使用Azure Machine Learning Studio做自然語言情感分析(1):資料處理及分類篇 前面的文章正好把應用程式的開發及部署都...
當本系列文章提到BERT時,最初是指Google所開發的BERT,但後續基本就是指所有運用Transformer和預訓練模式的語言模型。今天這篇文章就是在廣義的...
在前兩篇,我們將影片評論的資料做了資料處理,也根據自然語言分析的幾個基本概念做了資料過濾及詞彙Entity的抽取及計算相關機率。在今天的實作,我們將繼續帶大家進...
前言 良葛格過世的消息對我來說十分衝擊,筆者從國中開始學 C 語言,就是一路看良哥的筆記長大,乃至於後來學的 Java, Python 以及很多軟體設計的思維都...