iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 7
0
AI & Data

Python&ML資料分析系列 第 7

【Day7】Python 讀寫

  • 分享至 

  • xImage
  •  

使用open打開檔後一定要記得調用檔物件的close()方法。比如可以用try/finally語句來確保最後能關閉檔。

file_object = open('thefile.txt')
 try:
      all_the_text = file_object.read( )
 finally:
      file_object.close( )

注:不能把open語句放在try塊裡,因為當打開檔出現異常時,檔物件file_object無法執行close()方法。
2.讀文件
讀文字檔

 input = open('data', 'r')
 #第二個參數默認為r
 input = open('data')

讀二進位檔案


 input = open('data', 'rb')

讀取所有內容

 file_object = open('thefile.txt')
 try:
      all_the_text = file_object.read( )
 finally:
      file_object.close( )

讀固定位元組

file_object = open('abinfile', 'rb')
 try:
     while True:
          chunk = file_object.read(100)
         if not chunk:
             break
          do_something_with(chunk)
 finally:
      file_object.close( )

讀每行

list_of_all_the_lines = file_object.readlines( )

如果檔是文字檔,還可以直接遍歷檔物件獲取每行:

for line in file_object:
      process line

3.寫文件
寫文字檔

output = open('data', 'w')

寫二進位檔案

output = open('data', 'wb')

追加寫文件

output = open('data', 'w+')

寫數據

 file_object = open('thefile.txt', 'w')
 file_object.write(all_the_text)
 file_object.close( )

寫入多行

 file_object.writelines(list_of_text_strings)

注意,調用writelines寫入多行在性能上會比使用write一次性寫入要高。
在處理日誌檔的時候,常常會遇到這樣的情況:日誌檔巨大,不可能一次性把整個檔讀入到記憶體中進行處理,例如需要在一台實體記憶體為 2GB 的機器上處理一個 2GB 的日誌檔,我們可能希望每次只處理其中 200MB 的內容。
在 Python 中,內置的 File 物件直接提供了一個 readlines(sizehint) 函數來完成這樣的事情。以下面的代碼為例:

 file = open('test.log', 'r')  sizehint = 209715200   # 200M  position = 0  lines = file.readlines(sizehint)  while not file.tell() - position < 0:         position = file.tell()         lines = file.readlines(sizehint)

每次調用 readlines(sizehint) 函數,會返回大約 200MB 的資料,而且所返回的必然都是完整的行資料,大多數情況下,返回的資料的位元組數會稍微比 sizehint 指定的值大一點(除最後一次調用 readlines(sizehint) 函數的時候)。通常情況下,Python 會自動將用戶指定的 sizehint 的值調整成內部緩存大小的整數倍。

一、用Python創建一個新檔,內容是從0到9的整數, 每個數位占一行:

#python
>>>f=open('f.txt','w')    # r唯讀,w可寫,a追加
>>>for i in range(0,10):f.write(str(i)+'\n')
.  .  .
>>> f.close()

二、檔內容追加,從0到9的10個隨機整數:

#python
>>>import random
>>>f=open('f.txt','a')
>>>for i in range(0,10):f.write(str(random.randint(0,9)))
.  .  .
>>>f.write('\n')
>>>f.close()

三、檔內容追加,從0到9的隨機整數, 10個數位一行,共10行:

#python
>>> import random
>>> f=open('f.txt','a')
>>> for i in range(0,10):
.  .  .     for i in range(0,10):f.write(str(random.randint(0,9))) 
.  .  .     f.write('\n')    
.  .  .
>>> f.close()

四、把標準輸出定向到檔:

#python
>>> import sys
>>> sys.stdout = open("stdout.txt", "w")
>>>  . . .

五、文件的讀寫
一、文件打開:

f = file(name[, mode[, buffering]])
入口參數:   name 檔案名
                  mode   選項,字串
                  buffering   是否緩衝 (0=不緩衝,1=緩衝, >1的int數=緩衝區大小)
返回值 : 檔物件
mode 選項:
"r"   以讀方式打開,只能讀檔 , 如果檔不存在,會發生異常      
"w" 以寫方式打開,只能寫檔, 如果檔不存在,創建該檔
                                                     如果檔已存在,先清空,再打開文件
"rb"   以二進位讀方式打開,只能讀檔 , 如果檔不存在,會發生異常      
"wb" 以二進位寫方式打開,只能寫檔, 如果檔不存在,創建該檔
                                                     如果檔已存在,先清空,再打開文件
"rt"   以文本讀方式打開,只能讀檔 , 如果檔不存在,會發生異常      
"wt" 以文本寫方式打開,只能寫檔, 如果檔不存在,創建該檔
                                                     如果檔已存在,先清空,再打開文件
"rb+"   以二進位讀方式打開,可以讀、寫檔 , 如果檔不存在,會發生異常      
"wb+" 以二進位寫方式打開,可以讀、寫檔, 如果檔不存在,創建該檔
                                                 如果檔已存在,先清空,再打開文件

二、關閉文件
f.close()
當文件讀寫完畢後,應關閉文件。
三、清空檔內容
f.truncate()
注意:僅當以 "r+" "rb+" "w" "wb" "wb+"等以可寫模式打開的檔才可以執行該功能。
四、文件的指針定位與查詢
(1)文件指針:
檔被打開後,其物件保存在 f 中, 它會記住檔的當前位置,以便於執行讀、寫操作,這個位置稱為檔的指標( 一個從檔頭部開始計算的位元組數 long 類型 )。
(2)文件打開時的位置:
以"r" "r+" "rb+" 讀方式, "w" "w+" "wb+"寫方式 打開的檔,
一開始,檔指標均指向檔的頭部。
(3) 獲取文件指針的值:
L = f.tell()
(4) 移動文件的指標
f.seek( 偏移量, 選項 )
選項 =0 時, 表示將檔指標指向從檔頭部到 "偏移量"位元組處。
選項 =1 時, 表示將檔指標指向從檔的當前位置,向後移動 "偏移量"位元組。
選項 =2 時, 表示將檔指標指向從檔的尾部,,向前移動 "偏移量"位元組。
五、從檔讀取指內容
1 文字檔(以"rt"方式打開的檔)的讀取
s = f.readline( )
返回值: s 是字串,從檔中讀取的一行,含行結束符。
說明: (1) 如果 len( s ) =0 表示已到檔案結尾
(2) 如果是檔的最後一行,有可能沒有行結束符
2 二進位檔案(以"rb"、"rb+"、"wb+" 方式打開的檔)的讀取
s = f.read( n )
對於圖片、視頻等檔必須使用b的模式讀寫
說明: (1) 如果 len( s ) =0 表示已到檔案結尾
(2) 文件讀取後,文件的指標向後移動 len(s) 位元組。
(3)如果磁軌已壞,會發生異常。


上一篇
【Day6】Python函數式
下一篇
【Day8】Python網路獲取资料
系列文
Python&ML資料分析17
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言