iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 3
2
AI & Data

人工智慧 vs.工人智慧系列 第 3

Day 03: 高手真的在民間

為什麼會選擇 PTT 文章來做實驗?如果你常看股市版,或許你會覺得有跟我一樣的感覺。

有人常說股版是反指標,作為一個攻城獅(工程師)兼分析屍(分析師),我們要有追根究柢的精神,就讓那我們就來試試看到底 PTT 是不是真的反指標 ? 還是反反指標 ?

https://ithelp.ithome.com.tw/upload/images/20191012/20119726OoDx6tEjlY.png

在這篇文章內我會將全部文章分析後所發現的結果列舉出一些真實案例:例如某些作者發表的文章跟股票指數的連動狀態。看完結果後有時候真的不能不相信,有些文章根本是神預測,像是汪洋中的燈塔 ; 但有好就有壞,既然知道是某些人是反指標,那跟著對做應該也會贏。

要怎麼確任我的猜測是對的,我想先來實驗兩件事,初步看看數據有沒有跟我自己個人想的一樣。

第一:誰法表的文章最多?

第二:誰發表的文章被推文數最多?

為什麼是這兩個數據?這個想法來自 從眾效應。想來看看只當個牆頭草會不會有效果?

我們先收集了從 2018/01/01到 2019/04/30 的 PTT Stock 版文章(大約 65,000 篇左右)來做一個統計 (詳細的資料使用方式之後幾天會有更詳細的說明),用來計算上面兩個數據如下:

1) 誰表的文章最多?
這是在PTT Stock發表數量前10名的作者ID以及發表的文章數量

  • coconing 866
  • comjj45 820
  • Sirius1812 800
  • nightwing 744
  • wickwolf 725 /images/emoticon/emoticon34.gif
  • ESunBoy 724
  • CLV518 670
  • deangod99 613
  • IanLi 585
  • eyespot 576

全部的數據列表可以參考這裡

https://github.com/deternan/PTT_Stock/blob/master/output/AuthorStatistical.txt

要注意的是,不是 top1 的作者就是一定最準,因為如果進去搜尋 coconing 與 comjj45 發表的文章,會發現都是po文“金額統計表”和“買賣超資料” ; 而Sirius1812則是股版版主,都是發表版務事項,其他如 CLV518 與deangod99 雖然發文數量也不少,但也都是新聞類型。其實這個這都不帶有主觀意思的文章,只有像 wickwolf 和IanLi 等人開始,才陸續帶有個人思維的文章出現,這時候比較能看出文章想表達的方向。

https://ithelp.ithome.com.tw/upload/images/20190904/20119726Z8z28QAbVd.png
coconing 發表文章列表; 2019/08/02 截圖

https://ithelp.ithome.com.tw/upload/images/20190904/20119726b5STf2WhY5.png
comjj45 發表文章列表; 2019/08/02 截圖

https://ithelp.ithome.com.tw/upload/images/20190904/20119726UVL17SHZ1N.png
Sirius1812 發表文章列表; 2019/08/02 截圖

然而,有趣的是 ESunBoy 這個帳號,果然是玉山鴿,名號不是叫假的,都是發表跟玉山金有關的文章,其實也注意一下這個帳號。

https://ithelp.ithome.com.tw/upload/images/20190904/20119726t6nrDRxWdX.png
nightwing 發表文章列表; 2019/08/02 截圖

從上面這些例子,可以看出其實在PTT的股市版確實有些人還蠻積極的在說明他對於某些股票的看法,如果願意再花點心思去閱讀他們發表的文章,可以發現有些內容挺有價值的。


2) 誰發表的文章被推文數最多?
這是在 PTT Stock 上所發表文章後被推文總數量前 10 名的作者ID以及被推文數量

  • wickwolf 732645
  • vendan5566 304143
  • justforsing 94027
  • Ax0101 87165
  • fill8800541 86178 /images/emoticon/emoticon07.gif
  • jj314257 79596
  • coconing 68274
  • Sirius1812 56230
  • annz 54435
  • borry6299 53919

全部的數據列表可以參考這裡

https://github.com/deternan/PTT_Stock/blob/master/output/AritlcePushedNumber.txt

初步比對了這兩個數值,很有趣的發現是有些作者ID皆出現在這兩個部分。仔細看一下就會發現,之所以文章數會被推得多也是因為該作者發表的文章數也多,而且這些文章雖然是新聞類型,但可能該日的特定新聞事情特別引人注目才會讓其他人進行推文或討論(例如 川普又在Twitter上發俵表時,這時候特別容易引起股民騷動)。

既然我們得到了這兩個數據,不知道大家是否開始對幾個作者ID有點眼熟 ? (如果你常看股版的話)。既然如此,以後在看PTT的同時,就多注意一下這些作者發表的文章囉。總結來說,是不是真的可以跟著某些作者發表的文章來做股票?也許是可以的,但我覺得還需要更多的數據來驗證這個理論,這部分我們就留待之後再做更深度的測試與驗證囉。


免責聲明:本文章提到的股市指數與說明皆為他人撰寫文章內容,包括:選股條件,買入條件,賣出條件和風險控制參數,只適用於文章內的解釋與說明,此提示及建議內容僅供參考之用,並不構成投資研究、認購、招攬或邀約任何人士投資任何投資產品或交易策略,亦不應視為投資建議。


上一篇
Day 02:入手前,你需要先了解
下一篇
Day 04:Let’s GO
系列文
人工智慧 vs.工人智慧30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
snk
iT邦新手 5 級 ‧ 2020-09-26 16:02:12

請問如果改用八卦版的分身與multi_ID的分身名單對照有辦法做對比嗎 ?

我要留言

立即登入留言