iT邦幫忙

2023 iThome 鐵人賽

DAY 4
0
AI & Data

30天網路爬蟲學習系列 第 4

DAY4-HTML標示語言

  • 分享至 

  • xImage
  •  

認識HTML標示語言

HTML標示語言(HyperText Markup Language)語法是源於SGML語言(Standard Generalized Markup Language),是一種功能強大的文件標示、管理和編排語言。

HTML標示語言目前的最新版本是HTML5,是一種文件內容的格式編排語言,不像SGML允許定義如何標示文件的標籤,HTML只是使用SGML慣用語法,即標籤屬性

標籤(Tags):

HTML標籤是一個字串符號,用來標示文字內容須套用的編排格式,例如:在開頭標籤和結尾標籤之中的文字內容,就是使用預設格式編排成一個文字段落。
範例:

<p>輸入段落內容</p>

<html>標籤:

是HTML網頁的根元素,一個容器元素,其內容是其他HTML標籤,擁有<head><body>兩個子標籤。
如果需要,<html>可以使用lang屬性指定網頁使用的語言。
範例:

<html lang=”zh-TW”>

標籤Lang屬性值,常用的2碼值有zh(中文)、fr(法文)、ja(日文)等,也可以加上「-」分隔的2碼國家或地區,例如:en-US是美式英文、zh-TW是台灣的正體中文。

<head>標籤:

<head>標籤的內容是標題元素,包含<title><meta><script><style>標籤。
例如:<meta>標籤可以指定網頁的編碼為utf-8。
範例:

<meta charset =”utf-8”>

<body>標籤:

<body>標籤才是真正編排的網頁內容,包含文字、超連結、圖片、表格、清單和表單等網頁內容。


屬性(Attributes):

HTML標籤擁有一些屬性來定義細部編排,例如:標籤的src、width和height屬性,可以指定顯示的圖檔和尺寸的寬與高。
範例:

<img src=“example.jpg” width=“100” height = “200”>

補充:

XML(Extensible Markup Language)可擴展標示語言也是一種標籤語言,寫法類似HTML,繼承SGML自訂標籤的優點,並刪除一些SGML複雜的部份,在功能上能夠補足HTML標籤的不足,並且擁有更多的擴充性。
XML不是用來編排內容,而是用來描述資料,因此,XML沒有HTML一般的預設標籤,使用者需要自行定義描述資料所需的各種標籤。
今天的分享就先到這邊啦!我們明天見~ /images/emoticon/emoticon41.gif

參考書籍資料:

文科生也可以輕鬆學習網路爬蟲


上一篇
DAY3-HTTP協定
下一篇
DAY5-CSS階層式樣式表
系列文
30天網路爬蟲學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言