亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

淺談Python中的bs4基礎(chǔ)

 更新時(shí)間:2018年10月21日 11:23:04   作者:回憶不說話  
今天小編就為大家分享一篇關(guān)于Python中的bs4基礎(chǔ),小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧

安裝

在命令提示符框中直接輸入pip install beautifulsoup4

介紹

beautifulsoup是python的一個(gè)第三方庫,和xpath一樣,都是用來解析html數(shù)據(jù)的。

引入

from bs4 import BeautifulSoup

使用

將一段文檔傳入BeautifulSoup的構(gòu)造方法,就能得到一個(gè)文檔的對(duì)象。

bs = BeautifulSoup(open('index.html',encoding='utf-8'),'lxml')
print(bs)

注意:這樣上傳文檔的話,BeautifulSoup里面需要兩個(gè)參數(shù)。一個(gè)為open方法,一個(gè)是固定寫法,也就是解析器。

open方法里面也同樣需要兩個(gè)參數(shù),一個(gè)是想要解析的數(shù)據(jù),另一個(gè)為設(shè)置編碼的格式。

(1)獲取網(wǎng)頁中的title標(biāo)簽

print(bs.title)

(2)獲取head標(biāo)簽及標(biāo)簽內(nèi)部的所有其他標(biāo)簽

print(bs.head)

(3)獲取當(dāng)中的第一個(gè)a標(biāo)簽

print(bs.a)

注意:獲取文檔當(dāng)中所有的xx當(dāng)中第一個(gè)xx或者第一個(gè)xx里面的內(nèi)容。都可以用bs.xx來獲取

(4)獲取指定標(biāo)簽的所有屬性

print(bs.a.attrs)

(5)獲取標(biāo)簽的屬性

print(bs.a['href'])

(6)獲取標(biāo)簽的文本內(nèi)容。

print(bs.a.string)

注意:string獲取的文本指的是本標(biāo)簽的文本,不包含子標(biāo)簽的文本

(7)contents能夠獲取指定標(biāo)簽下面的所有內(nèi)容。

print(bs.body.contents)

(8)獲取所有內(nèi)容當(dāng)中指定索引的內(nèi)容

print(bs.div.contents[3])

(9)通過id和類名來找標(biāo)簽

print(bs.find(id='kw'))
print(bs.find(class_='shopping'))

注意:id是唯一的,通過id來找,只能找到一個(gè),所以用find,而class不是唯一的,通過class來找,就有可能找到多個(gè)。

(10)select選擇指定的標(biāo)簽

print(bs.select('title'))
print(bs.select('a'))

在bs4中,小數(shù)點(diǎn)“.”表示類名,#表示id

print(bs.select('.first'))
print(bs.select('#kw'))
print(bs.select('div.now'))

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接

相關(guān)文章

  • vscode+PyQt5安裝詳解步驟

    vscode+PyQt5安裝詳解步驟

    這篇文章主要介紹了vscode+PyQt5安裝詳解步驟,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-08-08
  • Python面向?qū)ο蟪绦蛟O(shè)計(jì)示例小結(jié)

    Python面向?qū)ο蟪绦蛟O(shè)計(jì)示例小結(jié)

    這篇文章主要介紹了Python面向?qū)ο蟪绦蛟O(shè)計(jì),結(jié)合實(shí)例形式總結(jié)分析了Python面向?qū)ο蟪绦蛟O(shè)計(jì)中比較常見的類定義、實(shí)例化、繼承、私有變量等相關(guān)使用技巧與操作注意事項(xiàng),需要的朋友可以參考下
    2019-01-01
  • 用xpath獲取指定標(biāo)簽下的所有text的實(shí)例

    用xpath獲取指定標(biāo)簽下的所有text的實(shí)例

    今天小編就為大家分享一篇用xpath獲取指定標(biāo)簽下的所有text的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • Python檢測(cè)字符串中是否包含某字符集合中的字符

    Python檢測(cè)字符串中是否包含某字符集合中的字符

    這篇文章主要介紹了Python檢測(cè)字符串中是否包含某字符集合中的字符,需要的朋友可以參考下
    2015-05-05
  • 深入理解NumPy簡(jiǎn)明教程---數(shù)組1

    深入理解NumPy簡(jiǎn)明教程---數(shù)組1

    這篇文章主要介紹了深入理解NumPy簡(jiǎn)明教程(二、數(shù)組1),NumPy數(shù)組是一個(gè)多維數(shù)組對(duì)象,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下。
    2016-12-12
  • Python永久配置國內(nèi)鏡像源安裝再也不用擔(dān)心卡頓

    Python永久配置國內(nèi)鏡像源安裝再也不用擔(dān)心卡頓

    這篇文章主要為大家介紹了Python如何永久配置國內(nèi)鏡像源,從此安裝再也不用擔(dān)心卡頓,有需要的朋友可以借鑒參考下,希望能夠有所幫助
    2021-10-10
  • PyTorch使用cpu加載模型運(yùn)算方式

    PyTorch使用cpu加載模型運(yùn)算方式

    今天小編就為大家分享一篇PyTorch使用cpu加載模型運(yùn)算方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2020-01-01
  • 聊聊python中的循環(huán)遍歷

    聊聊python中的循環(huán)遍歷

    這篇文章主要介紹了python中的循環(huán)遍歷的相關(guān)資料,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下
    2020-09-09
  • Python的爬蟲包Beautiful Soup中用正則表達(dá)式來搜索

    Python的爬蟲包Beautiful Soup中用正則表達(dá)式來搜索

    這篇文章主要介紹了Python的爬蟲包Beautiful Soup中用正則表達(dá)式來搜索的技巧,包括使用正則表達(dá)式去搜索多種可能的關(guān)鍵字以及查找屬性值未知的標(biāo)簽等,需要的朋友可以參考下
    2016-01-01
  • 機(jī)器學(xué)習(xí)10大經(jīng)典算法詳解

    機(jī)器學(xué)習(xí)10大經(jīng)典算法詳解

    這篇文章主要為大家詳細(xì)介紹了機(jī)器學(xué)習(xí)10大經(jīng)典算法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2017-12-12

最新評(píng)論