因為我們之後需要知道每篇文章到底講的好不好 (準不準),那我們一定要有一個標準當作參考。一個最簡單的參考就是直接拿每天的股市收盤價當作參考,例如某篇文章在今天提...
圖片來源:https://unsplash.com/photos/mcAUHlGirVs 前兩天已經將各股日成交資料存成.csv檔了,接著就來利用這些資料...
前幾天,我爸突然問我說,excel有沒有辦法自己幫我更新某幾個特定欄位阿,不然我每天自己手動填那些股票的收盤價好累喔,原本我以為可能五六隻而已,結果一看才發現...
一、前言 矮子能看得更遠,只因為他站在巨人的肩膀上。 - Isaac Newton 今天的文章,我將著眼於過去研究,探討之前的研究人員,在股市預測下應用了...
以個人生活費, 計算出每日必要的開銷, 以我個人大約是 $700 / 日 但是股市並沒有每天交易, 平均一週只有 4 天有交易, 所以每天要有收入 (...
前面提到了我們要使用 PTT 的文章當作資料集,所以今天就來教大家怎麼當個爬蟲抓資料。 相信大家直接 Google “文章爬蟲”會找到許多教學文件,也有許多現有...
各位早安,今天是第24天,但其實爬蟲的技巧大致上已經教得差不多了,而且我猜會看我的文章的人,應該都想知道爬蟲還可以做哪些應用吧,所以我想鐵人賽的最後幾天,就來做...
複習一下昨天的進度 - 我們取得單月的個股日成交價的資料,並在電腦中儲存成csv檔。 目前都只有單月的個股日成交價,但如果想要一整年的個股日成交價時,該怎麼辦呢...
PTT 是台灣最大的電子佈告欄(bbs),常有笑話都說記者只要缺題材上PTT上找就好。不只是找新聞,連發大財的機會都有可能,其實 .. 這是真的 !! 相信大...
為什麼會選擇 PTT 文章來做實驗?如果你常看股市版,或許你會覺得有跟我一樣的感覺。 有人常說股版是反指標,作為一個攻城獅(工程師)兼分析屍(分析師),我們要有...
我們在之前一直提到,要用 PTT 文章來找出一些股市訊號,那文章怎麼找出一些特地的訊息,其實有蠻多種方式可以進行。第一種就是純文字的部分,可以用 “語意理解”、...
班長:65K2步槍大部分解開始 兵:大部分解開始 取下彈匣,檢查托彈鈑是否正常。 正常 分解槍背帶 … 阿 … 不是 這個大部分解啦,在搞什麼 ? 我們在上一...
從這裡開始,開始需要執行程式。在之後的範例裡面,我們會把所有的 functions 都先放在 TaggingMain_Sample.java 裡。 文章列表為了...
前面三篇都在講概念跟初步驗證,到了這裡終於要進入開發的部分。今天會把之後開發上使用到的程式語言與平台等相關資訊做一次說明,並依序寫上總共需要開發哪些 func...
前言 透過爬取國內上市櫃股票一覽表,以及股價歷史數據,來建立量化投資所需的小工具,除了能針對自己心目中的標的進行分析,也能透過適當的投資策略,在茫茫股海中打撈...
如果大家都有成功照上一篇講的自己刻好了一個標記器的 UI 或是也利用範例檔成功執行起來,那我們就可以來講在這邊我們做好的標記器需要呈現哪些資料了。 圖1. 圖1...
這邊要講怎麼改善資料的辨識。 什麼叫做資料的辨識? 前面一直提到說所有的資料是靠人工標記後當作之後使用的資料集,那在標記的過程中常常遇到一些狀況是包括哪些呢?以...
前言 股市的動量指標是以股價波動震盪為分析目標,藉由觀察價格的漲跌的頻率與幅度,進行未來價格變化的預估準則。由於動量指標倚仗的是過去一段時間內的平均動量數據,...
上一篇講了兩個數字:1)誰表的文章最多 2) 誰發表的文章被推文數最多?今天要看另外兩個數字: 每個 user 累積推文的數量 文章被推文的數量 同樣的,範...
前面講完了標記器介面的開發,接下來就是要說明我們要標記的文章特性,因為文章太多類型,也有很多“雜訊”,怎麼選出有價值的文章變得相對重要。 在前幾天的文章中我們有...
這一篇我們來說明我們標記 “positive” 和 “negative” 的標準在哪裡。 前面有提到,評估文章的好壞會依據該文章提到的公司股價未來的指數當作一個...