iT邦幫忙

DAY 6
1

從魯蛇到蟒蛇--網頁(站)靜(動)態分析工具開發系列 第 6

[Day 06] urllib-03

今天是google生日耶!祝它16歲生日快樂~

今日學習目標,網址的分析,在python3可以使用 urllib.parse 模組

https://www.my-website.idv.tw:8080/testpage.php?get=val#hash

分析一下上述的網址,不需要麻煩的正規表示式,只需要使用模組就好!﹝模組萬歲!﹞

import urllib.parse

targeturl = "https://www.my-website.idv.tw:8080/testpage.php?get=val#hash"

obj = urllib.parse
data = obj.urlparse( targeturl )

print( data )

print( data.scheme )
print( data.netloc )
print( data.path )
print( data.params )
print( data.query )
print( data.fragment )

學這些模組的使用並不難,google一下,多翻點書,找點範例,勤勞一點,連我這種不聰明的人都能學會XD

同場加映,POST 和 GET 傳送資料時,需要先 urlencode ,為什麼 python 的含數名稱不用 urldecode / urlencode 就好?

data2 = obj.quote( targeturl )
print( data2 )

data3 = obj.unquote( data2 )
print( data3 )

這兩天一直遇到編碼問題,在python上處理總是遇到許多困擾,utf8轉ascii啦!urlencode decode 啦!最後雖然達成目標編碼,總覺得用的不是很順手,有待訓練...
上述的編碼已經難倒我了!現在又遇上十六進位轉ascii等等的問題,真是一個頭兩個大!

繼續和 /x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0/x0 搏鬥去...

以上,也向現在還在工作的工程師致敬!


上一篇
[Day 05] urllib-02
下一篇
[Day 07] urllib-04
系列文
從魯蛇到蟒蛇--網頁(站)靜(動)態分析工具開發30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言