python爬蟲爬取bilibili網(wǎng)頁基本內(nèi)容
用爬蟲爬取bilibili網(wǎng)站排行榜游戲類的所有名稱及鏈接:
導(dǎo)入requests
、BeautifulSoup
import requests from bs4 import BeautifulSoup
然后我們需要插入網(wǎng)站鏈接并且要解析網(wǎng)站并打印出來:
e = requests.get('https://www.bilibili.com/v/popular/rank/game') ? #當(dāng)前網(wǎng)站鏈接 html = e.content soup = BeautifulSoup(html,'html.parser') ? ?#解析html print(soup)
我們可以看到密密麻麻的代碼函數(shù),但不太簡潔明了,我們?nèi)?yōu)化一下
繼續(xù)插入如下代碼這個(gè)代碼是可以爬取我們想要的類,可以更簡介的簡化代碼
div_people_list = soup.find('ul', attrs={'class': 'rank-list'}) ?#爬取ul類class為rank-list下的數(shù)據(jù)
可以看到還是不夠簡介:
繼續(xù)插入如下代碼:
ca_s = div_people_list.find_all('a', attrs={'class': 'title'}) ? #爬取a類class為title下的數(shù)據(jù)
可以看到鏈接及主題都提取出來了,但還是有瑕疵:
我們加入這行代碼挨個(gè)打印并提取標(biāo)題及鏈接,由于鏈接提取出來的是//www.bilibili.com/video/BV1yZ4y1D7ef
前面沒有http:點(diǎn)擊進(jìn)去會(huì)出現(xiàn)錯(cuò)誤,所有我們需要在前面加入http:進(jìn)行連接在一起打印
for t in ca_s: ? ? url = t['href'] ? ? name = t.get_text() ? ? print(name+'\t點(diǎn)擊鏈接直接觀看鏈接:'+f'http:{url}')
可以看到我們的標(biāo)題及連接都爬取出來了
完整代碼:
import requests from bs4 import BeautifulSoup ? e = requests.get('https://www.bilibili.com/v/popular/rank/game') ? #當(dāng)前網(wǎng)站鏈接 html = e.content soup = BeautifulSoup(html,'html.parser') ? ?#解析html div_people_list = soup.find('ul', attrs={'class': 'rank-list'}) ?#爬取ul類class為rank-list下的數(shù)據(jù) ca_s = div_people_list.find_all('a', attrs={'class': 'title'}) ? #爬取a類class為title下的數(shù)據(jù) ? #挨個(gè)傳輸?shù)絫,然后打印數(shù)據(jù) for t in ca_s: ? ? url = t['href'] ? ? name = t.get_text() ? ? print(name+'\t點(diǎn)擊鏈接直接觀看鏈接:'+f'http:{url}')
到此這篇關(guān)于python爬蟲爬取bilibili網(wǎng)頁基本內(nèi)容的文章就介紹到這了,更多相關(guān)python爬取bilibili網(wǎng)頁內(nèi)容內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python爬蟲爬取指定內(nèi)容的解決方法
- Python爬蟲爬取百度搜索內(nèi)容代碼實(shí)例
- python爬蟲開發(fā)之使用python爬蟲庫requests,urllib與今日頭條搜索功能爬取搜索內(nèi)容實(shí)例
- python爬取內(nèi)容存入Excel實(shí)例
- Python爬蟲爬取新浪微博內(nèi)容示例【基于代理IP】
- python爬取網(wǎng)頁內(nèi)容轉(zhuǎn)換為PDF文件
- Python下使用Scrapy爬取網(wǎng)頁內(nèi)容的實(shí)例
- 基于Python實(shí)現(xiàn)web網(wǎng)頁內(nèi)容爬取的方法
相關(guān)文章
Python實(shí)現(xiàn)打磚塊小游戲代碼實(shí)例
這篇文章主要介紹了Python打磚塊小游戲,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-05-05Python中實(shí)現(xiàn)常量(Const)功能
這篇文章主要介紹了Python中實(shí)現(xiàn)常量(Const)功能,python語言本身沒有提供const,本文使用一個(gè)類來實(shí)現(xiàn)常量定義功能,并介紹了使用方法,需要的朋友可以參考下2015-01-01python進(jìn)階從青銅到王者一定會(huì)用上的Python技巧
這篇文章主要介紹了python進(jìn)階從青銅到王者一定會(huì)用上的Python技巧,本文通過幾個(gè)Python的小案例,讓大家體會(huì)其中蘊(yùn)含的技巧一起來圍觀吧2021-09-09Python深度學(xué)習(xí)之FastText實(shí)現(xiàn)文本分類詳解
FastText是一種典型的深度學(xué)習(xí)詞向量的表示方法,它非常簡單通過Embedding層將單詞映射到稠密空間,然后將句子中所有的單詞在Embedding空間中進(jìn)行平均,進(jìn)而完成分類操作2022-09-09python自動(dòng)化腳本安裝指定版本python環(huán)境詳解
這篇文章主要為大家詳細(xì)介紹了python自動(dòng)化腳本安裝指定版本python環(huán)境的相關(guān)方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-09-09Windows+Anaconda3+PyTorch+PyCharm的安裝教程圖文詳解
這篇文章主要介紹了Windows+Anaconda3+PyTorch+PyCharm的安裝教程,本文通過圖文并茂的形式給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-04-04