iT邦幫忙

2021 iThome 鐵人賽

DAY 16
1
AI & Data

AI ninja project系列 第 16

AI ninja project [day 16] 文字處理 -- 迴歸

我們已經有了語音轉文字的技術,
那我們也能將文字進行向量化。

那我們是否能收集客服人員顧客的回答,
然後將回應進行量化,
當作對客服人員考績的參考呢?

這篇參考autokeras的文字迴歸攻略:
https://autokeras.com/tutorial/text_regression/

colab:
https://colab.research.google.com/github/keras-team/autokeras/blob/master/docs/ipynb/text_regression.ipynb

安裝套件及載入:
https://ithelp.ithome.com.tw/upload/images/20210916/20122678hnFBF7xaPV.png

https://ithelp.ithome.com.tw/upload/images/20210916/20122678rufWM9ozeO.png

一樣使用IMDB影評的資料集,
不同於之前載入資料集的方法,這裡採用sklearn的load_files來載入資料集
可以發現已經自動幫忙把pos及neg兩個類別,轉換成0或1的數值:
https://ithelp.ithome.com.tw/upload/images/20210916/20122678UUbzdqWoDO.png

https://ithelp.ithome.com.tw/upload/images/20210916/20122678tN3EP95DER.png

這裡我們採用autokeras的TextRegressor來進行訓練,並將測試集預測結果印出:
https://ithelp.ithome.com.tw/upload/images/20210916/20122678hoHY15ogrA.png

https://ithelp.ithome.com.tw/upload/images/20210916/20122678T4LepSclDj.png

可以發現預測結果為介於0到1之前的數值。

官網也特別說明可以使用tensorflow dataset的資料格式用來訓練:
https://ithelp.ithome.com.tw/upload/images/20210916/20122678rmuegbxO5q.png


上一篇
AI ninja project [day 15] 文字處理--BERT分類
下一篇
AI ninja project [day 17] 時間序列預測
系列文
AI ninja project30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言