iT邦幫忙

DAY 14
1

鐵人三十真的不輕鬆啊!每天都得逼自己寫出一點程式進度,大學時期也沒這麼認真過啊!﹝是大學時期太混吧!﹞

總之,連一半15都還沒過啊!這樣就想放棄也還太早吧?人生也不會只過15年就不想過了吧?雖然很想睡覺,還是逼自己來寫程式了...

正題開始...

把網站抓下來後,卻不知該如何處理,仔細看了一下之前的程式,改了一下儲存的方法,這樣子會比較好抓目標吧?

reStr = "<([\w]+) (.*?)>";
reObj = re.compile( reStr.format() )
    
targetTag = reObj.findall( str( data.decode( "utf-8" ) ) )
    
TagList = []
for x in targetTag:
    TagList.append( x ) 

將標籤放在 List 的第一個,屬性即值放入第二個,這樣就可以先找目標標籤,再來分析其中的屬性,不過該使用split還是正規還得再嘗試一下,這非常不適合在眼睛快瞇上的我來思考...

今天進度太少了...假日玩太兇,但是也不的不準備睡覺了!明天還要上班,先停手了。

以上!晚安!


上一篇
[Day 13] 弄個sample的網站,免得搞壞別人的網站
下一篇
[Day 15]sitemap-02
系列文
從魯蛇到蟒蛇--網頁(站)靜(動)態分析工具開發30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言