零基礎(chǔ)寫(xiě)python爬蟲(chóng)之爬蟲(chóng)框架Scrapy安裝配置
前面十章爬蟲(chóng)筆記陸陸續(xù)續(xù)記錄了一些簡(jiǎn)單的Python爬蟲(chóng)知識(shí),
用來(lái)解決簡(jiǎn)單的貼吧下載,績(jī)點(diǎn)運(yùn)算自然不在話下。
不過(guò)要想批量下載大量的內(nèi)容,比如知乎的所有的問(wèn)答,那便顯得游刃不有余了點(diǎn)。
于是乎,爬蟲(chóng)框架Scrapy就這樣出場(chǎng)了!
Scrapy = Scrach+Python,Scrach這個(gè)單詞是抓取的意思,
Scrapy的官網(wǎng)地址:點(diǎn)我點(diǎn)我。
那么下面來(lái)簡(jiǎn)單的演示一下Scrapy的安裝流程。
具體流程參照:http://chabaoo.cn/article/48607.htm
友情提醒:一定要按照Python的版本下載,要不然安裝的時(shí)候會(huì)提醒找不到Python。建議大家安裝32位是因?yàn)橛行┌姹镜谋貍滠浖?4位不好找。
1.安裝Python(建議32位)
建議安裝Python2.7.x,3.x貌似還不支持。
安裝完了記得配置環(huán)境,將python目錄和python目錄下的Scripts目錄添加到系統(tǒng)環(huán)境變量的Path里。
在cmd中輸入python如果出現(xiàn)版本信息說(shuō)明配置完畢。
2.安裝lxml
lxml是一種使用 Python 編寫(xiě)的庫(kù),可以迅速、靈活地處理 XML。點(diǎn)擊這里選擇對(duì)應(yīng)的Python版本安裝。
3.安裝setuptools
用來(lái)安裝egg文件,點(diǎn)擊這里下載python2.7的對(duì)應(yīng)版本的setuptools。
4.安裝zope.interface
可以使用第三步下載的setuptools來(lái)安裝egg文件,現(xiàn)在也有exe版本,點(diǎn)擊這里下載。
5.安裝Twisted
Twisted是用Python實(shí)現(xiàn)的基于事件驅(qū)動(dòng)的網(wǎng)絡(luò)引擎框架,點(diǎn)擊這里下載。
6.安裝pyOpenSSL
pyOpenSSL是Python的OpenSSL接口,點(diǎn)擊這里下載。
7.安裝win32py
提供win32api,點(diǎn)擊這里下載
8.安裝Scrapy
終于到了激動(dòng)人心的時(shí)候了!安裝了那么多小部件之后終于輪到主角登場(chǎng)。
直接在cmd中輸入easy_install scrapy回車(chē)即可。
9.檢查安裝
打開(kāi)一個(gè)cmd窗口,在任意位置執(zhí)行scrapy命令,得到下列頁(yè)面,表示環(huán)境配置成功。
相關(guān)文章
pdf論文中python畫(huà)的圖Type 3 fonts字體不兼容的解決方案
這篇文章主要介紹了pdf論文中python畫(huà)的圖Type 3 fonts字體不兼容的解決方案,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04Python?Bleach保障網(wǎng)絡(luò)安全防止網(wǎng)站受到XSS(跨站腳本)攻擊
Bleach?不僅可以清理?HTML?文檔,還能夠?qū)︽溄舆M(jìn)行處理,檢查是否是合法格式,并可以使用白名單來(lái)控制哪些?HTML?標(biāo)簽、屬性是安全的,因此非常適合用于清潔用戶輸入的數(shù)據(jù),確保網(wǎng)站安全2024-01-01python嵌套函數(shù)使用外部函數(shù)變量的方法(Python2和Python3)
這篇文章主要介紹了python嵌套函數(shù)使用外部函數(shù)變量的方法,需要的朋友可以參考下2016-01-01Python實(shí)現(xiàn)的中國(guó)剩余定理算法示例
這篇文章主要介紹了Python實(shí)現(xiàn)的中國(guó)剩余定理算法,結(jié)合實(shí)例形式分析了中國(guó)剩余定理的概念、原理及具體算法實(shí)現(xiàn)技巧,需要的朋友可以參考下2017-08-08Python實(shí)現(xiàn)Restful API的例子
今天小編就為大家分享一篇Python實(shí)現(xiàn)Restful API的例子,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-08-08Django提示mysql版本過(guò)低:django.db.utils.NotSupportedError: My
這篇文章主要介紹了Django提示mysql版本過(guò)低:django.db.utils.NotSupportedError: MySQL 8 or later is required (found 5.7.26).的解決方法,文中有詳細(xì)的解決方案,具有一定的參考價(jià)值,需要的朋友可以參考下2024-03-03python操作微信自動(dòng)發(fā)消息的實(shí)現(xiàn)(微信聊天機(jī)器人)
這篇文章主要介紹了python操作微信自動(dòng)發(fā)消息(微信聊天機(jī)器人),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-07-07