Python爬取某平臺短視頻的方法
前言
本文的文字及圖片來源于網(wǎng)絡(luò),僅供學(xué)習(xí)、交流使用,不具有任何商業(yè)用途,如有問題請及時聯(lián)系我們以作處理。
基本開發(fā)環(huán)境
Python 3.6
Pycharm
相關(guān)模塊的使用
import os import requests
安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。
一、確定需求
爬取搞笑趣味欄目的視頻內(nèi)容。
二、網(wǎng)站數(shù)據(jù)分析
首先需要明確一點,好看視頻網(wǎng)站加載方式是懶加載的方式,需要你下滑網(wǎng)頁才會加載出新的內(nèi)容
加載出來的內(nèi)容里面有音頻播放地址以及標(biāo)題。
內(nèi)容比較簡單,看代碼就行
import os import requests url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486' headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36' } response = requests.get(url=url, headers=headers) json_data = response.json() videos = json_data['data']['response']['videos'] for index in videos: title = index['title'] play_url = index['play_url'] video_content = requests.get(url=play_url, headers=headers).content path = 'video\\' if not os.path.exists(path): os.mkdir(path) with open(path + title + '.mp4', mode='wb') as f: f.write(video_content) print('正在保存:', title)
到此這篇關(guān)于Python爬取某平臺短視頻的方法的文章就介紹到這了,更多相關(guān)Python爬取短視頻內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解pyenv下使用python matplotlib模塊的問題解決
這篇文章主要介紹了詳解pyenv下使用python matplotlib模塊的問題解決,非常具有實用價值,需要的朋友可以參考下2018-11-11python subprocess 殺掉全部派生的子進(jìn)程方法
下面小編就為大家?guī)硪黄猵ython subprocess 殺掉全部派生的子進(jìn)程方法。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-01-01Python matplotlib讀取excel數(shù)據(jù)并用for循環(huán)畫多個子圖subplot操作
這篇文章主要介紹了Python matplotlib讀取excel數(shù)據(jù)并用for循環(huán)畫多個子圖subplot操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-07-07Django Auth應(yīng)用實現(xiàn)用戶身份認(rèn)證
Django Auth 應(yīng)用一般用在用戶的登錄注冊上,用于判斷當(dāng)前的用戶是否合法。本文將介紹Auth的另一個功能,即認(rèn)證用戶身份,感興趣的同學(xué)可以關(guān)注一下2021-12-12Python運行出現(xiàn)DeprecationWarning的問題及解決
這篇文章主要介紹了Python運行出現(xiàn)DeprecationWarning的問題及解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-07-07