在第15天時,我們探討了關於資料處理的一些項目.
其中有一項是過濾資料,今天開始介紹過濾資料的
利器,正規表示式(Regular Expression).
我們將以Python的ipython互動方式,以利舉例示範.
因為若是用檔案搭配指令方式,會顯得較為冗長.
進入 ipython以後先 import re
基本比對的方式為
re.search(pattern, string)
先來看例子:
In [1]: import re
In [2]: re.search("[1234567890]", "5")
Out[2]: <_sre.SRE_Match at 0x11623d8>
注意到不管是 pattern, 或是 string, 都是要用 " " 包起來;
而pattern用[]包起來,代表列舉.
我們可以看到pattern與"5" 符合 , 所以回應了SRE_Match,代表有搜尋到.
接著再來看
In [3]: re.search("[1234567890]", "x")
沒有任何輸出.這就是回應 None.
但是這樣互動Shell的沒輸出,不利於我們判斷;
所以我們可以再加上 != None 的方式.
In [4]: re.search("[1234567890]", "x") != None
Out[4]: False
In [5]: re.search("[1234567890]", "5") != None
Out[5]: True
這樣只要看到True就代表有符合;False就代表沒符合.