這些是beautifulsoup的語法,雖然不是每個都用到,但是多少還是要看一下喲!
尤其是關於尋找標籤的語法要多多注意
| 方法 | 語法示例 | 說明 | 
|---|---|---|
| 導入模組 | from bs4 import BeautifulSoup | 
導入Beautiful Soup模組 | 
| 創建對象 | soup = BeautifulSoup(html, 'html.parser') | 
創建Beautiful Soup對象,解析HTML內容 | 
| 找到標籤 | tag = soup.find('tag_name') | 
找到第一個符合條件的標籤 | 
| 找到所有標籤 | tags = soup.find_all('tag_name') | 
找到所有符合條件的標籤,返回列表 | 
| 獲取標籤內容 | content = tag.get_text() | 
獲取標籤內的文字內容 | 
| 尋找子元素 | child = tag.find('child_tag_name') | 
尋找第一個子元素標籤 | 
| 尋找所有子元素 | children = tag.find_all('child_tag_name') | 
尋找所有子元素標籤,返回列表 | 
| 尋找父元素 | parent = tag.parent | 
獲取父元素標籤 | 
| 尋找兄弟元素 | next_sibling = tag.next_sibling | 
獲取下一個同層級元素 | 
| 尋找前一個兄弟元素 | prev_sibling = tag.previous_sibling | 
獲取上一個同層級元素 | 
| 尋找所有後續兄弟元素 | siblings = tag.find_next_siblings() | 
尋找所有後續同層級元素,返回列表 | 
| 尋找所有前一個兄弟元素 | siblings = tag.find_previous_siblings() | 
尋找所有前面同層級元素,返回列表 | 
| 使用CSS選擇器選取標籤 | tags = soup.select('css_selector') | 
使用CSS選擇器選取標籤,返回列表 | 
| 返回第一個符合選擇器的標籤 | tag = soup.select_one('css_selector') | 
返回第一個符合選擇器的標籤 | 
| 檢查標籤是否具有特定屬性 | if tag.has_attr('attribute_name'): ... | 
檢查標籤是否具有指定的屬性 | 
| 檢查標籤是否具有多個特定屬性 | if tag.has_attrs({'attr1': 'value1', 'attr2': 'value2'}): ... | 
檢查標籤是否具有多個指定的屬性 | 
下一篇來終於要來實際操做啦!