使用open打開檔後一定要記得調用檔物件的close()方法。比如可以用try/finally語句來確保最後能關閉檔。
file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )
注:不能把open語句放在try塊裡,因為當打開檔出現異常時,檔物件file_object無法執行close()方法。
2.讀文件
讀文字檔
input = open('data', 'r')
#第二個參數默認為r
input = open('data')
讀二進位檔案
input = open('data', 'rb')
讀取所有內容
file_object = open('thefile.txt')
try:
all_the_text = file_object.read( )
finally:
file_object.close( )
讀固定位元組
file_object = open('abinfile', 'rb')
try:
while True:
chunk = file_object.read(100)
if not chunk:
break
do_something_with(chunk)
finally:
file_object.close( )
讀每行
list_of_all_the_lines = file_object.readlines( )
如果檔是文字檔,還可以直接遍歷檔物件獲取每行:
for line in file_object:
process line
3.寫文件
寫文字檔
output = open('data', 'w')
寫二進位檔案
output = open('data', 'wb')
追加寫文件
output = open('data', 'w+')
寫數據
file_object = open('thefile.txt', 'w')
file_object.write(all_the_text)
file_object.close( )
寫入多行
file_object.writelines(list_of_text_strings)
注意,調用writelines寫入多行在性能上會比使用write一次性寫入要高。
在處理日誌檔的時候,常常會遇到這樣的情況:日誌檔巨大,不可能一次性把整個檔讀入到記憶體中進行處理,例如需要在一台實體記憶體為 2GB 的機器上處理一個 2GB 的日誌檔,我們可能希望每次只處理其中 200MB 的內容。
在 Python 中,內置的 File 物件直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。以下面的代碼為例:
file = open('test.log', 'r') sizehint = 209715200 # 200M position = 0 lines = file.readlines(sizehint) while not file.tell() - position < 0: position = file.tell() lines = file.readlines(sizehint)
每次調用 readlines(sizehint) 函數,會返回大約 200MB 的資料,而且所返回的必然都是完整的行資料,大多數情況下,返回的資料的位元組數會稍微比 sizehint 指定的值大一點(除最後一次調用 readlines(sizehint) 函數的時候)。通常情況下,Python 會自動將用戶指定的 sizehint 的值調整成內部緩存大小的整數倍。
一、用Python創建一個新檔,內容是從0到9的整數, 每個數位占一行:
#python
>>>f=open('f.txt','w') # r唯讀,w可寫,a追加
>>>for i in range(0,10):f.write(str(i)+'\n')
. . .
>>> f.close()
二、檔內容追加,從0到9的10個隨機整數:
#python
>>>import random
>>>f=open('f.txt','a')
>>>for i in range(0,10):f.write(str(random.randint(0,9)))
. . .
>>>f.write('\n')
>>>f.close()
三、檔內容追加,從0到9的隨機整數, 10個數位一行,共10行:
#python
>>> import random
>>> f=open('f.txt','a')
>>> for i in range(0,10):
. . . for i in range(0,10):f.write(str(random.randint(0,9)))
. . . f.write('\n')
. . .
>>> f.close()
四、把標準輸出定向到檔:
#python
>>> import sys
>>> sys.stdout = open("stdout.txt", "w")
>>> . . .
五、文件的讀寫
一、文件打開:
f = file(name[, mode[, buffering]])
入口參數: name 檔案名
mode 選項,字串
buffering 是否緩衝 (0=不緩衝,1=緩衝, >1的int數=緩衝區大小)
返回值 : 檔物件
mode 選項:
"r" 以讀方式打開,只能讀檔 , 如果檔不存在,會發生異常
"w" 以寫方式打開,只能寫檔, 如果檔不存在,創建該檔
如果檔已存在,先清空,再打開文件
"rb" 以二進位讀方式打開,只能讀檔 , 如果檔不存在,會發生異常
"wb" 以二進位寫方式打開,只能寫檔, 如果檔不存在,創建該檔
如果檔已存在,先清空,再打開文件
"rt" 以文本讀方式打開,只能讀檔 , 如果檔不存在,會發生異常
"wt" 以文本寫方式打開,只能寫檔, 如果檔不存在,創建該檔
如果檔已存在,先清空,再打開文件
"rb+" 以二進位讀方式打開,可以讀、寫檔 , 如果檔不存在,會發生異常
"wb+" 以二進位寫方式打開,可以讀、寫檔, 如果檔不存在,創建該檔
如果檔已存在,先清空,再打開文件
二、關閉文件
f.close()
當文件讀寫完畢後,應關閉文件。
三、清空檔內容
f.truncate()
注意:僅當以 "r+" "rb+" "w" "wb" "wb+"等以可寫模式打開的檔才可以執行該功能。
四、文件的指針定位與查詢
(1)文件指針:
檔被打開後,其物件保存在 f 中, 它會記住檔的當前位置,以便於執行讀、寫操作,這個位置稱為檔的指標( 一個從檔頭部開始計算的位元組數 long 類型 )。
(2)文件打開時的位置:
以"r" "r+" "rb+" 讀方式, "w" "w+" "wb+"寫方式 打開的檔,
一開始,檔指標均指向檔的頭部。
(3) 獲取文件指針的值:
L = f.tell()
(4) 移動文件的指標
f.seek( 偏移量, 選項 )
選項 =0 時, 表示將檔指標指向從檔頭部到 "偏移量"位元組處。
選項 =1 時, 表示將檔指標指向從檔的當前位置,向後移動 "偏移量"位元組。
選項 =2 時, 表示將檔指標指向從檔的尾部,,向前移動 "偏移量"位元組。
五、從檔讀取指內容
1 文字檔(以"rt"方式打開的檔)的讀取
s = f.readline( )
返回值: s 是字串,從檔中讀取的一行,含行結束符。
說明: (1) 如果 len( s ) =0 表示已到檔案結尾
(2) 如果是檔的最後一行,有可能沒有行結束符
2 二進位檔案(以"rb"、"rb+"、"wb+" 方式打開的檔)的讀取
s = f.read( n )
對於圖片、視頻等檔必須使用b的模式讀寫
說明: (1) 如果 len( s ) =0 表示已到檔案結尾
(2) 文件讀取後,文件的指標向後移動 len(s) 位元組。
(3)如果磁軌已壞,會發生異常。