今天是google生日耶!祝它16歲生日快樂~
今日學習目標,網址的分析,在python3可以使用 urllib.parse 模組
https://www.my-website.idv.tw:8080/testpage.php?get=val#hash
分析一下上述的網址,不需要麻煩的正規表示式,只需要使用模組就好!﹝模組萬歲!﹞
import urllib.parse
targeturl = "https://www.my-website.idv.tw:8080/testpage.php?get=val#hash"
obj = urllib.parse
data = obj.urlparse( targeturl )
print( data )
print( data.scheme )
print( data.netloc )
print( data.path )
print( data.params )
print( data.query )
print( data.fragment )
學這些模組的使用並不難,google一下,多翻點書,找點範例,勤勞一點,連我這種不聰明的人都能學會XD
同場加映,POST 和 GET 傳送資料時,需要先 urlencode ,為什麼 python 的含數名稱不用 urldecode / urlencode 就好?
data2 = obj.quote( targeturl )
print( data2 )
data3 = obj.unquote( data2 )
print( data3 )
這兩天一直遇到編碼問題,在python上處理總是遇到許多困擾,utf8轉ascii啦!urlencode decode 啦!最後雖然達成目標編碼,總覺得用的不是很順手,有待訓練...
上述的編碼已經難倒我了!現在又遇上十六進位轉ascii等等的問題,真是一個頭兩個大!
繼續和 /x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0 搏鬥去...
以上,也向現在還在工作的工程師致敬!