iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

人工智慧 vs.工人智慧 系列

用 PTT 股市版文章來找出未來的股票趨勢,也許吧 我想 ..

鐵人鍊成 | 共 30 篇文章 | 37 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day 11:打造自己的小天地

標記工具的使用不要太複雜,越簡單當然越好,而且畫面一定要有 UI 介面。這裡我們直接使用 Swing 來開發,所以邊我們快速地來講解一下我們需要用到哪些元件。標...

2019-09-12 ‧ 由 phelps 分享
DAY 12

Day 12:小天地裡的遊戲規則

如果大家都有成功照上一篇講的自己刻好了一個標記器的 UI 或是也利用範例檔成功執行起來,那我們就可以來講在這邊我們做好的標記器需要呈現哪些資料了。 圖1. 圖1...

2019-09-13 ‧ 由 phelps 分享
DAY 13

Day 13:小天地裡的遊戲 (上集)

前面講完了標記器介面的開發,接下來就是要說明我們要標記的文章特性,因為文章太多類型,也有很多“雜訊”,怎麼選出有價值的文章變得相對重要。 在前幾天的文章中我們有...

2019-09-14 ‧ 由 phelps 分享
DAY 14

Day 14:小世界裡的遊戲 (下集)

如果你真的有開始嘗試去標記一些文章,相信你一定有遇這些問題不知道該怎麼標記: 一篇文章內出現很多混亂訊息 沒特別寫出對於個股看好或和壞 文章內容沒有意義時...

2019-09-15 ‧ 由 phelps 分享
DAY 15

Day 15:小世界裡的好人與壞人

這一篇我們來說明我們標記 “positive” 和 “negative” 的標準在哪裡。 前面有提到,評估文章的好壞會依據該文章提到的公司股價未來的指數當作一個...

2019-09-16 ‧ 由 phelps 分享
DAY 16

Day 16: 電腦也要懂妳

在前面一直提到我們得到的 PTT 文章都是文字呈現,那怎麼讓電腦也看得懂呢?因為最終的計算是個兩類別的分類問題,所以這邊我們把所有的文章轉成數值,也就是每一篇文...

2019-09-17 ‧ 由 phelps 分享
DAY 17

Day 17: 文字與數字之間的戀愛

前面一直提到要把文字轉乘數值,在前一天也有講到了目前常見的轉換方式。那我們今天直接講一下如何把文字轉成數值。 fasttext 是 Facebook 所提供的...

2019-09-18 ‧ 由 phelps 分享
DAY 18

Day 18:要餵對食物

在上一篇提到的字詞轉向量,通常的做法一定是一整篇文章直接進行斷詞斷字的動作,然而為了降低一些運算量或是說想剃除掉一些比較無意義的字詞,例如:語助詞或是介系詞等...

2019-09-19 ‧ 由 phelps 分享
DAY 19

Day 19:文字 vs. 數字

前一天提到了斷詞,這樣等於是把一篇文章分解開來。那現在有了個別的字詞之後,就可以把字詞轉換為電腦可以讀入的數值。 之前一篇有提到,可以利用 fasttext 進...

2019-09-20 ‧ 由 phelps 分享
DAY 20

Day 20:分類器 與 分類氣

當我們已經將文字轉成數值,接下來就是要利用分類的計算方式來進行好壞文章的分類。 在說明我們使用的分類演算法前,先用一篇的章節來說明各分類器的優缺點,以便讓大家對...

2019-09-21 ‧ 由 phelps 分享