iT邦幫忙

DAY 10
1

從魯蛇到蟒蛇--網頁(站)靜(動)態分析工具開發系列 第 10

[Day 10] HTML 標籤分析-03

挑戰日數從個位數邁入十位數了,公司的工作項目也從個位數進到十位數了,下班時間也越來越晚了!科技業一定得這麼悲慘嗎?自己實力不足,我想這才是晚下班的原因吧!

老闆總是說要培養 Troubleshooting 能力,但是當 Troublemaker 太多時,火力在強也是會被人海淹沒的...

言歸正傳,昨天把程式的正規式功能搞定了,今天來研究一下尋找標籤的正規式吧!這邊推薦一個好用的網站!

http://www.regexr.com/

這個網站能在線上輸入正規式,並立刻幫你標出文章中符合的字串!真是太方便了!
首先,要招出 HTML 的標籤頭

<([\w]+).*?\/>  單一封裝的標籤   例如 <img src="img.jpg"/>
<([\w]+).*?>    非單一封裝的標籤 例如 <tr class="tr_tr">
<([\w]+)        只有頭           例如 <a 
<\/([\w]+)>     只有尾巴         例如 </div>

再來只需要分析標籤屬性,使用spilt去分割空白就可以了!

接下來思考要如何寫成程式吧!

以上,晚安!


上一篇
[Day 09] HTML 標籤分析-02
下一篇
[Day 11] HTML 標籤分析-04
系列文
從魯蛇到蟒蛇--網頁(站)靜(動)態分析工具開發30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言