之前在參考這位老兄的文章,
他是以單一檔股票的多日資料去進行機器學習的分析和預測。
**參考欄位是 日期(date)、券商(vendor)、買張(buy)、賣張(sell)、買賣超(BuyOverSell),
**
對耶,地緣券商,很符合這個題目的初衷,券商的地理位置就可以拿來當空間資料。
如果配合上券商的地址、地理位置,是不是就可以做時空序列分析了~!
(感覺會做出很有趣的東西)
這個作者教了許多爬蟲的方法和實例,
接著往前繼續看這個作者的文章,看看他的研究題目的目標和資料欄位是什麼。
在這篇08.爬股市每日價、量看到了我要找的東西,
columns= ['日期', '成交股數', '成交金額', '開盤價', '最高價', '最低價', '收盤價', '漲跌價差', '成交筆數']
兩個都參考了一下,決定欄位暫定成兩種資料
股票代號, 日期, 券商, 買張, 賣張, 買賣超資訊, 券商分點位置
ex. 1104, 20231212, 1041臺銀鳳山, 6, 0, 6, XX市YY區ZZ路
要抓的是 2023/12/12這天,
所有券商(例如:1041臺銀鳳山)針對1104這檔股票的買賣張數,以及券商的分點位置。
股票代號, 日期, 開盤價, 收盤價, 最高價, 最低價, 成交量
ex. 1104, 20231212, 23, 24, 27, 21, 5964
另外要抓的是 1104這檔股票,不同日期(看要抓取的目標時間區間)每天的開、高、收、低四個價位。
如果兩份資料合併在一起,大概會像這樣(預想中)
昨天我們使用FinMind 能拿到股價資料 (不過還需要做前處理來篩選)。
籌碼資料,結果免費仔不行...@@
不過倒是拿到了券商分點的地址,超棒!
這時我們想到了一開始的 買賣日報表查詢系統 !
要找找其他辦法,可能要依靠爬蟲了..!
參考資料&資料來源:
每日記錄:
加權指數:21469,上漲598.9點,主要因美國領失業補助金的人沒有想像中的多,讓市場氣氛高漲。
一個開超高收更高,經濟衰退的疑慮好像又不見了(?