請教python 大神關於對資料夾下所有檔案進行運算

#pandas path os stock

f222487931 2021-01-22 17:01:54 ‧ 3486 瀏覽

分享至

目前已經寫好對路徑C:/Users/011328/Desktop/python/globle/grid_j2yzvjrl.xlsx"
的運算，目前困難點是我要對資料目錄(C:/Users/011328/Desktop/python/globle/)
所有檔案進行以下的腳本運算，要如何寫?是要用迴圈嗎，因為每天檔案不固定，pandas的路徑pd.read_excel似乎只能指定檔名?

import pandas as pd
data = pd.read_excel("C:/Users/011328/Desktop/python/globle/grid_j2yzvjrl.xlsx") # 把 excel 格式的檔案讀取成一個 DataFrame
print(data.columns) # 印出欄位名稱

取得股數總和

TQ = data["Qty"].sum()
print("股數總和",TQ)

取得總PXQ = amount

amount = data['Px']*data['Qty']

新增欄位Amount 總額

data['Amount'] = amount

取得amount總額

TAmount = amount.sum()
#新增均價欄位並計算均價
Aver_P = TAmount/TQ
print(Aver_P)

新增最後一列並加上總股數及總額

new = pd.DataFrame({'Security':'',
'交易所代碼':'',
'Qty':TQ,
'Px':'',
'Fill Time':'',
'Exec Brkr':'',
'Maker/Taker':'',
'Amount':TAmount,
'N':Aver_P},index=[1])
data1 = data.append(new, ignore_index= True)
print(data1)

froce iT邦大師 1 級 ‧ 2021-01-22 17:17:02 檢舉

https://www.runoob.com/python/os-listdir.html

你會用到這個。

登入發表討論

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

3 個回答

海綿寶寶

iT邦大神 1 級 ‧ 2021-01-22 17:39:35

參考看看這篇

回應
分享
檢舉

登入發表回應

ccutmis

iT邦高手 2 級 ‧ 2021-01-22 21:41:39

之前寫過類似的作法提供樓主參考
(函式 process_xlsx_with_pandas 請據需求自行改寫)

import os
import pandas as pd

# 列出dir_loc目錄所有檔案，可用allow_file_type指定檔案副檔名類型
def dir_list(dir_loc,allow_file_type=[]):
    tmp_list=[]
    #print('allow_file_type length:'+len(allow_file_type))
    for path, subdirs, files in os.walk(dir_loc):
        for name in files:
            is_match=False
            if len(allow_file_type)>0: 
                if get_file_type(name) in allow_file_type:
                    is_match=True
            else:
                is_match=True
            if is_match==True:
                tmp_list.append(os.path.join(path, name))
    return tmp_list

# 取得副檔名格式
def get_file_type(file_path_and_name):
    return file_path_and_name.split(".")[-1]

# 這裡請樓主自己改寫
def process_xlsx_with_pandas(xlsx_loc):
    print("PROCESSED XLSX NAME: "+xlsx_loc)
    data = pd.read_excel(xlsx_loc)
    ... 略 ...
    print(data1)

if __name__ == '__main__':
    xlsx_dir_path=r"C:\Users\011328\Desktop\python\globle\"
    xlsx_list=dir_list(xlsx_dir_path,["xlsx"])
    for i in xlsx_list:
        process_xlsx_with_pandas(i)

回應
分享
檢舉

登入發表回應

echochio

iT邦高手 1 級 ‧ 2021-01-23 19:16:42

尋找多層目錄會用

import os
os.walk(path)

只有一層目錄會用

import glob
list_array = glob.glob(path+"*.xlsx")

哈 .... 我用 linux ...
windows 理論上也可以

回應
分享
檢舉

登入發表回應

我要發表回答

立即登入回答

參賽組數

1064 組

團體組數

40 組

累計文章數

22210 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

請教python 大神 關於對資料夾下所有檔案進行運算

取得股數總和

取得 總PXQ = amount

新增欄位Amount 總額

取得amount總額

新增最後一列 並加上 總股數 及總額

3 個回答

我要發表回答

標記使用者

請教python 大神關於對資料夾下所有檔案進行運算

取得總PXQ = amount

新增最後一列並加上總股數及總額