Python視頻爬蟲實現(xiàn)下載頭條視頻功能示例
本文實例講述了Python視頻爬蟲實現(xiàn)下載頭條視頻功能。分享給大家供大家參考,具體如下:
一、需求分析
抓取頭條短視頻
思路:
分析網(wǎng)頁源碼,查找解析出視頻資源url(查看源代碼,搜mp4)
對該url發(fā)起請求,返回二進制數(shù)據(jù)
將二進制數(shù)據(jù)保存為視頻格式
視頻鏈接:
http://video.eastday.com/a/170612170956054127565.html
二、代碼實現(xiàn)
# encoding: utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') import requests import re import time time1=time.time() main_url = 'http://video.eastday.com/a/170612170956054127565.html' resp = requests.get(main_url) #沒有這行,打印的結(jié)果中文是亂碼 resp.encoding = 'utf-8' html = resp.text link = re.findall(r'var mp4 = "(.*?)";', html)[0] link = 'http:'+link dest_resp = requests.get(link) #視頻是二進制數(shù)據(jù)流,content就是為了獲取二進制數(shù)據(jù)的方法 data = dest_resp.content #保存數(shù)據(jù)的路徑及文件名 path = u'C:/趙麗穎.mp4' f = open(path, 'wb') f.write(data) f.close() time2 = time.time() print u'ok,下載完成!' print u'總共耗時:' + str(time2 - time1) + 's
"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下載完成!
總共耗時:3.20499992371s
Process finished with exit code 0
成功下載可以播放~
更多關(guān)于Python相關(guān)內(nèi)容可查看本站專題:《Python Socket編程技巧總結(jié)》、《Python正則表達式用法總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門與進階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對大家Python程序設(shè)計有所幫助。
相關(guān)文章
Python保存數(shù)據(jù)到文件的實現(xiàn)方式
這篇文章主要介紹了Python保存數(shù)據(jù)到文件的實現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-11-11Python爬取網(wǎng)站圖片并保存的實現(xiàn)示例
這篇文章主要介紹了Python爬取網(wǎng)站圖片并保存的實現(xiàn)示例,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習或者工作具有一定的參考學(xué)習價值,需要的朋友們下面隨著小編來一起學(xué)習學(xué)習吧2021-02-02