超級簡略的單股買賣模擬器

11th鐵人賽

預計撐兩天XD

2019-09-16 21:20:16

3483 瀏覽

分享至

零、引言

我期望能夠有個簡單的環境來檢視我所做的action是對的還是錯的，所以我今天想要試著寫一個簡單的模擬器，並反饋簡單的賺賠狀況。鑒於完全沒有碰過，實在撞了不少牆壁Orz，最後才簡單地寫了一個版本出來。

要鞭要打...我用聽的就好-3-

另一個希望一個這樣的環境還有一個原因，接下來我會用不同的模型進行測試，這可以是一個評斷訓練結果好壞的工具!! 話不多說，上程式碼...

一、實作內容

主要功能
- 1. 可以紀錄當下狀態和以前狀態的環境
- 1. 每次給定一個action都會更新狀態和返回對這個動作的評價分數
對於評價分數
- 我將(現在的資產總和-上一次的資產總和) 得到的分數，+越多代表目前獲利越多，反之亦然
- 之後可能會修正，最主要是到真正應用的時候會再次修改

二、程式碼

環境程式碼段

import numpy as np

class stockEvn_single:
    __lot = 0
    __mean_price = 0
    __state_assets = 0
    
    def __init__(self, money=1000):
        self.__money = money
        self.__money_init = money
        self.__state_assets = self.getAssets()
    
    def getInfo(self):
        print('stock count : ', self.__lot, ', stock value : ', self.__mean_price, ', money leave : ', self.__money,
              ', assets', self.__state_assets)
    
    def doAction(self, stock_price, action, s_prop):
        '''
        stock_price : the price of stock
        action : 0, sell; 1, do nothing, 2, buy
        s_prop : a float between 0-1
        '''
        return self.__calculate_price(stock_price=stock_price, action=action, s_prop=s_prop)
    
    def __calculate_price(self, stock_price, action, s_prop):
        if action == 0:
            can_sell = self.__lot
            sell = int(s_prop * can_sell)
            self.__doSell(stock_price=stock_price, quan=sell)
        elif action == 1:
            self.__doNothing()
        elif action == 2:
            can_buy = int(self.__money / stock_price)
            buy = int(s_prop * can_buy)
            self.__doBuy(stock_price=stock_price, quan=buy)
        now_state = self.__getAssetsState(stock_price=stock_price)
        loss = now_state - self.__state_assets
        self.__state_assets = now_state
        return loss
        
    def __doSell(self, stock_price, quan):
        if quan < 1:
            return self.__doNothing()
        else:
            if stock_price < self.__mean_price:
                loss = 1
            else:
                loss = 0
            self.__lot -= quan
            self.__money += (quan * stock_price)
            return 
        
    def __doBuy(self, stock_price, quan):
        if quan < 1:
            return self.__doNothing()
        else:
            if stock_price > self.__mean_price:
                loss = 1
            else:
                loss = 0
            value_stock = self.__lot * self.__mean_price
            self.__lot += quan
            value_stock += (quan * stock_price)
            self.__mean_price = value_stock / self.__lot
            self.__money -= (quan * stock_price)
            return
        
    def __doNothing(self):
        return
    
    def getAssets(self):
        return self.__money + self.__lot * self.__mean_price
    
    def __getAssetsState(self, stock_price):
        return self.__lot * stock_price + self.__money

簡單測試

env = stockEvn_single()
env.getInfo()

get_loss = []
get_loss.append(env.doAction(stock_price=200, action=2, s_prop=0.6))
env.getInfo()
get_loss.append(env.doAction(stock_price=210, action=2, s_prop=1))
env.getInfo()
get_loss.append(env.doAction(stock_price=250, action=2, s_prop=1))
env.getInfo()
get_loss.append(env.doAction(stock_price=340, action=0, s_prop=0.6))
env.getInfo()
get_loss.append(env.doAction(stock_price=390, action=2, s_prop=1))
env.getInfo()
get_loss.append(env.doAction(stock_price=300, action=0, s_prop=0))
env.getInfo()
print('loss = ', get_loss)

輸出

stock count :  0 , stock value :  0 , money leave :  1000 , assets 1000

stock count :  3 , stock value :  200.0 , money leave :  400 , assets 1000
stock count :  4 , stock value :  202.5 , money leave :  190 , assets 1030
stock count :  4 , stock value :  202.5 , money leave :  190 , assets 1190
stock count :  2 , stock value :  202.5 , money leave :  870 , assets 1550
stock count :  4 , stock value :  296.25 , money leave :  90 , assets 1650
stock count :  4 , stock value :  296.25 , money leave :  90 , assets 1290
loss =  [0, 30, 160, 360, 100, -360]