PTT 是台灣最大的電子佈告欄(bbs),常有笑話都說記者只要缺題材上PTT上找就好。不只是找新聞,連發大財的機會都有可能,其實 .. 這是真的 !! 相信大...
今天,先不講技術相關的東西。為了讓每個閱讀者更快速進入之後文章提到內容,我們先假設讀者對於股票市場不是完全了解,所以這一篇先講一下股市基本名稱,相信對於之後的...
為什麼會選擇 PTT 文章來做實驗?如果你常看股市版,或許你會覺得有跟我一樣的感覺。 有人常說股版是反指標,作為一個攻城獅(工程師)兼分析屍(分析師),我們要有...
前面三篇都在講概念跟初步驗證,到了這裡終於要進入開發的部分。今天會把之後開發上使用到的程式語言與平台等相關資訊做一次說明,並依序寫上總共需要開發哪些 func...
前面提到了我們要使用 PTT 的文章當作資料集,所以今天就來教大家怎麼當個爬蟲抓資料。 相信大家直接 Google “文章爬蟲”會找到許多教學文件,也有許多現有...
從這裡開始,開始需要執行程式。在之後的範例裡面,我們會把所有的 functions 都先放在 TaggingMain_Sample.java 裡。 文章列表為了...
班長:65K2步槍大部分解開始 兵:大部分解開始 取下彈匣,檢查托彈鈑是否正常。 正常 分解槍背帶 … 阿 … 不是 這個大部分解啦,在搞什麼 ? 我們在上一...
上一篇講了兩個數字:1)誰表的文章最多 2) 誰發表的文章被推文數最多?今天要看另外兩個數字: 每個 user 累積推文的數量 文章被推文的數量 同樣的,範...
因為我們之後需要知道每篇文章到底講的好不好 (準不準),那我們一定要有一個標準當作參考。一個最簡單的參考就是直接拿每天的股市收盤價當作參考,例如某篇文章在今天提...
我們在之前一直提到,要用 PTT 文章來找出一些股市訊號,那文章怎麼找出一些特地的訊息,其實有蠻多種方式可以進行。第一種就是純文字的部分,可以用 “語意理解”、...