iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

人工智慧 vs.工人智慧 系列

用 PTT 股市版文章來找出未來的股票趨勢,也許吧 我想 ..

鐵人鍊成 | 共 30 篇文章 | 36 人訂閱 訂閱系列文 RSS系列文
DAY 21

Day 21:分類氣 (一)

分類器 .. 應該是要講 氣死人的 "氣" 上一篇提到我們會使用這三個監督式的分類演算法: 支持向量機 (Support Vector...

2019-09-22 ‧ 由 phelps 分享
DAY 22

Day 22:分類氣 (二)

今天來講一下分類器評估的方式。 一般常見的評估法 (evaluation) 有蠻多資料可以參考,在這裡就是快速的說而已,並不會琢磨太多。主要要講解的會是我們採用...

2019-09-23 ‧ 由 phelps 分享
DAY 23

Day 23:你好還是我好 ?

前面提到了怎麼標記文章的好壞,以及我們打算使用的分類演算法,接下來要先講一下把文字轉成數值 (Arff, attribute-relation file for...

2019-09-24 ‧ 由 phelps 分享
DAY 24

Day 24:我錯了, 怎麼改

前一天我們做了初步的測試,得到了一個鳥鳥的結果,正確率幾乎只有跟丟銅板差不多。這樣的結果實在讓人無法接受,因此想了幾個方法來改善這個問題。 分類問題可以依據幾...

2019-09-25 ‧ 由 phelps 分享
DAY 25

Day 25:第一招 改進資訊辨識成果

這邊要講怎麼改善資料的辨識。 什麼叫做資料的辨識? 前面一直提到說所有的資料是靠人工標記後當作之後使用的資料集,那在標記的過程中常常遇到一些狀況是包括哪些呢?以...

2019-09-26 ‧ 由 phelps 分享
DAY 26

Day 26:第二招 分類器最佳化

前面用三種分類計算得到的結果非常令我不甚滿意,於是只好想辦法怎麼修正這個問題。 好啦,坦白說、其實也沒有什麼招數 ? 就我所知的部分,分類器要改善最終的辨識率時...

2019-09-27 ‧ 由 phelps 分享
DAY 27

Day 27:第三招 資料面改善

上一篇想辦法去改善分類演算法但似乎改善幅度不高,正所謂山不轉路轉,如果分類器改善不了,那何不來改善一下資料面的問題呢? 針對資料的部分我們會用以下三種方式重新處...

2019-09-28 ‧ 由 phelps 分享
DAY 28

Day 28:第四招 資料降維

資料降維其實對於分類計算還蠻用的,所以這一篇來講一下我們怎麼降低資料維度然後達到提升分類正確率提升。資料降維這個動作也可以被稱為特徵選取 (feature se...

2019-09-29 ‧ 由 phelps 分享
DAY 29

Day 29:發大財了沒 ?

在前面四天我們依序提到了改善資料分類的方式,從最原始的資料處理到後來的分類演算法和資料降維,所有的目的當然是希望所有的結果可以驗證最原始提出概念:從 PTT...

2019-09-30 ‧ 由 phelps 分享
DAY 30

Day 30:後會有期

終於第 30 天了,也就是說終於可以脫離文章地獄 ? 最後一篇不要寫技術了,來講講心得。(看之前大家不都這樣嗎?) 這一次寫的主題其實兩年前就想做了,去年一整...

2019-10-01 ‧ 由 phelps 分享