之前文章中,我對一個簡單的資料集Google_Stock_Price dataset
進行測試,並大致上確認了接下來的方向。 我們必須擁有更多的輸入資料、更大的數據集,以及更複雜的網路模型。 為此,如果我們繼續對國外資料進行測試,實在是浪費了硬體資源,所以今天來淺談台灣股票市場以及運用網路資源蒐集股票資料。
之後主要使用的程式碼皆放在最後的
參考
中
我完全不是念相關領域的,也從未接觸過股票市場,所以如有說錯請用力鞭打
爬完資料,我認為台灣股票市場約有四種股票類型 : 「上市」、「上櫃」、「興櫃/未上市」和「期貨」
類型 | 漲跌幅限制 | 交易平台 | 炒作空間 |
---|---|---|---|
上市 | 上市五日後10% | TWSE 臺灣證券交易所 | 高,流量大 |
上櫃 | 上市五日後10% | TWSE 臺灣證券交易所 | 偏高 |
興櫃 | 沒有 | TWSE 臺灣證券交易所 | 低 |
未上市 | 沒有 | 私下 | 低 |
期貨 | 沒有 | TWSE 臺灣證券交易所 | 高 |
我原本以為只要沒有漲跌幅限制的都有很高的炒作空間,也以為像上市這種已經趨於穩定的商品應該要有比較低的炒作空間,後來經過自己查詢和詢問後,得到的答案是興櫃/未上市在台灣經濟起飛那段才比較多,當時的有成功存活的公司也都大部分上市上櫃了。上市上櫃公司因為交易量大,所以有可能有更多的炒作空間。
那麼我們下一步要預測什麼呢?
根據幾天前的測試結果,我認為可以嘗試短線預測,針對上市公司來執行短線買賣動作,我需要蒐集盤中五秒交易資訊、日K和大盤趨勢,這些都可以從台灣證券交易所 爬 到資料,讓我們試試看吧!
其實我之前有寫過,每日自動蒐集即時股票資料,然後上傳到Google Firebase雲端資料庫。 但之後沒有繼續使用了~ 今天我並不會把它拿出來用,而是用網路上大神已經寫好的套件XD (請看最下面
參考
) 在這邊不提供教學,可以直接到參考
看,都說得非常清楚(發懶),這邊最主要是一個簡單的統整。
為何只能從網路? 因為證券公司的app只能「看」,我們無法取得數據線,如果要用證券公司的API通常都要繳費或是需要繁雜程序,此時如果我們不想這麼麻煩,最快的方式就是透過網路爬蟲把你要的資料爬下來!!
雖然平常就是爬這兩個,但其實管道還有許多,我們的上一屆鐵人大神就有一篇簡短的介紹13.股市資料爬蟲苦主。
要使用Python http訪問套件requests
,我們就要先知道HTTP有幾種method。
method | 用途 |
---|---|
get | 取得資料 |
head | 取得get的http header |
put | 新增資料,會overwrite |
post | 新增資料,不會overwrite |
patch | 更新擴充資料 |
delete | 刪除資料 |
get
方式爬到資料post
可以爬到更詳細的資料接下來大致上會如開頭所說,針對短線投資策略下去預測,今天先休息一下XD
超簡單台股每日爬蟲教學
Python 財報爬蟲
Asoul/tsrtc Taiwan Stock Real Time Crawler
Asoul/tsec Taiwan Stock Exchange Crawler
常見的HTTP METHOD的不同性質分析:GET,POST和其他4種METHOD的差別