大家早安,昨天示範了國民好兄弟SVM實作跟比較進階的文本情感分析方式。但是做出來的時候結果不是很好,所以我在文章結束的時候留了一個懸念(其實就是我太懶而已)...
大家午安~講了那麼多天模型訓練,想必大家應該都有點膩了吧?今天就來點不一樣的(其實是為了明天鋪路)。在之前的文章裡面,我們提到很多計算詞頻的方法跟變體,但是...
午安各位~昨天講解完支持向量機(Support Vector Machine)的原理之後,今天要用推特上面對不同產品的評價來進行文本情感分析。會需要做這件事...
昨天簡單介紹過python裡面的資料型態以後,今天會針對NLP必備的字串處理進行介紹。 1️⃣字串處理 單雙引號區別 昨天提到在宣告一個變數是字串的時候...
早安各位,今天是還債日。之前在講斷詞斷句的時候有提到要出一個文字雲教學,但是因為時間安排的關係就被移到今天了。廢話不多說,大家應該都看過文字雲吧?就是下面那...
嗨大家!昨天簡單介紹了斷詞對NLP的重要性,也示範了怎麼用NLTK對英文文本進行段詞跟統整。雖然NLTK提供多種不同語言的服務,當中也包含中文,但它終究是以...
嗨大家!為了呼應今天的標題,讓我請出國小課本裡面被用來強調標點符號重要性的短句來問候各位。 下雨天留客天留我不留 請試著在這個短句裡面加上標點符號或...
大家午安~本系列文章終於進入最後五天,我們也終於要開始認識現在最流行的機器學習方式-深度學習了。本來是計畫可以連實作一起分享的,但光是概念理解就已經夠要命了...
嗨大家!今天的開頭是問答遊戲!請問在機器學習運作的流程中,通常哪一個階段最耗時間呢? (A) 資料前處理(B) 機器訓練(C) 參數調整(D) 結果評估...
大家午安~今天要跟大家介紹這個系列的最後兩種監督是機器學習模型-決策樹(Decision Tree)跟隨機森林(Random Forest)。不知道大家還記...
經歷昨天對神經網路跟深度學習的講解,不知道大家還好嗎?今天要順著上一篇的內容來講講深度學習可以怎麼應用在NLP上面。 當初在介紹詞袋模型的時候,我們提到...
哈囉~雖然資料前處理的階段已經結束了,產出今天要介紹的各位皇親國戚應該還算是在前處理的範圍內,畢竟特徵萃取不太能算在模型訓練的一環,好吧反正他們就是地位尷尬...
任務簡介 意圖分析, 表示 ⇒ 輸入文字敘述, 要分類文字屬於何種意圖 sample: "i dont like my current insuran...
午安各位!昨天介紹過決策樹跟隨機森林的原理之後,今天我們要來實做這兩個模型。因為昨天有提到這兩種模型可以做不只兩種類別的分類,所以今天我們就跟上次一樣用,用...
前言 文章開始之前先做一下簡單地個人背景介紹。我是主修語言學的在讀研究生,雖然高中念的是理組,但大學主修教育,四年來完全跟程式語言還有AI這些東西八竿子打不...
自然語言處理就是讓機器學會像人一樣理解並處理語言。 昨天簡單介紹了我所理解的自然語言處理,今天就要開始進入教學文的部分。我們可以把整個NLP的過程看成是...
大家午安~昨天講解RNN的時候提到RNN的缺點就是容易產生梯度消失或梯度爆炸的問題,所以今天要介紹為了解決這兩個問題而產生的RNN變體-長短期記憶(Long...
嗨各位!昨天跟大家介紹了正規表達式的使用方法,還是老話一句,多練習就會自然而然熟悉跟內化。學會用正規表達是可以幫我們省去很多時間,所以一起成為努力型人才吧~...
嗨!昨天簡單介紹過機器學習之後,今天就來跟大家分享評估成效幾個比較常見的計算方法。 不知道大家以前有沒有看過牛奶花生的廣告,就是那個用電腦選花生的廣告。...
大家午安~終於來到鐵人賽最後一天了。今天要講點輕鬆的東西,跟各位分享一下我自己的NLP專案實作過程。也就是說這有很大的機率跟業界在做的事情不一樣,因為身為研...
嗨大家(如果有人在看的話)~前兩天介紹了一些python資料處理的基本用法,介紹的都是python內建的函式,但其實python的價值絕對不止於這些內建的東...
午安~昨天介紹了貝式分類器的原理之後,今天就要在python裡面實際操作一次看看,也順便把之前還沒講解怎麼實作的詞袋模型當成特徵一起示範。事不宜遲我們馬上開...
大家早安,今天要帶大家認識第二個監督式機器學習的經典模型-羅吉斯迴歸(Logistic Regression)。雖然羅吉斯迴歸叫做羅吉斯迴歸,但他其實不是迴...
諸位早安,我們終於結束漫長的資料前處理教學了。之前在講前處理的過程中,我一直提到電腦很笨,只認得數字的事情,大家應該還記得吧。問題來了,我們到底要怎麼把文字...
嗨大家!經過幾天這系列文章第一天提到過NLP的目標就是要讓電腦可以像人一樣理解並處理語言,而想做到這樣的事情就需要語言學的規則來幫忙。這其實是NLP領域最開...
大家早安!歷經了四天針對經典監督式機器學習模型的了解,我們也算是小~小~的踏進NLP世界裡了。如果把這比喻成FPS(第一人稱射擊遊戲)的話,大概就是開局撿完...
大家早安,不知知覺竟然已經完成鐵人賽的三分之一,真的是太快了。快到我的存稿都沒了從今天開始大概率每天都是最新鮮的文章了XDD 希望我可以順利完成。 回到...
早安大家,昨天講解了詞性標註在NLP領域的重要性跟怎麼實作之後,今天要介紹詞性標註背後的隱藏式馬可夫模型(HMM)到底是運用什麼原理在運算。應該會是這個系列...
哈囉大家,今天終於要正式進入模型訓練的階段了,真是可喜可賀,可喜可賀。雖然現在各種fancy的深度學習模型都非常強大,也能達到比機器學習還要好很多的成效,但...
大家午安,昨天介紹過羅吉斯迴歸的原理之後,今天要帶大家實作羅吉斯迴歸的模型,任務是要偵測推特上的貼文是否有憂鬱傾向。在NLP的領域裡面,我們把這種分析文本情...