快速部署 Scrapy項(xiàng)目scrapyd的詳細(xì)流程
快速部署 Scrapy項(xiàng)目 scrapyd
給服務(wù)端 install scrapyd
pip install scrapyd -i https://pypi.tuna.tsinghua.edu.cn/simple
運(yùn)行
scrapyd
修改配置項(xiàng) , 以便遠(yuǎn)程訪問(wèn)
使用Ctrl +c 停止 上一步的運(yùn)行的scrapyd
在要運(yùn)行scrapyd 命令的路徑下,新建文件scrapyd.cnf 文件
輸入以下內(nèi)容
[scrapyd]
# 網(wǎng)頁(yè)和Json服務(wù)監(jiān)聽(tīng)的IP地址,默認(rèn)為127.0.0.1(只有改成0.0.0.0 才能在別的電腦上能夠訪問(wèn)scrapyd運(yùn)行之后的服務(wù)器)
bind_address = 0.0.0.0
# 監(jiān)聽(tīng)的端口,默認(rèn)為6800
http_port = 6800
# 是否打開(kāi)debug模式,默認(rèn)為off
debug = off
在客戶端 install scrapyd-client
1. 安裝 scrapy-client 命令如下
pip install scrapyd-client -i https://pypi.tuna.tsinghua.edu.cn/simple
配置Scrapy 項(xiàng)目
修改 scrapy.cfg 文件
1 檢查配置
scrapyd-deploay -l
發(fā)布scrapy項(xiàng)目到scrapyd所在的服務(wù)器(此時(shí)爬蟲(chóng)未運(yùn)行)
# scrapyd-deploy <target> -p <project> --version <version> # taget : 就是前面配置文件里的deploy后面的的target名字,例如 ubuntu1 # project: 可以隨意定義, 建議與 scrapy 爬蟲(chóng)項(xiàng)目名相同 # version: 自定義版本號(hào) 不寫(xiě)的話默認(rèn)為當(dāng)前時(shí)間戳, 一般不寫(xiě) scrapyd-deploy ubuntu-1 -p douban
注意
爬蟲(chóng)目錄下不要放無(wú)關(guān)的py文件,放無(wú)關(guān)的py文件會(huì)導(dǎo)致發(fā)布失敗,但是當(dāng)爬蟲(chóng)發(fā)布成功后,會(huì)在當(dāng)前目錄生成一個(gè)setup.py文件,可以刪除掉。
4.發(fā)送運(yùn)行爬蟲(chóng)命令
curl http://10.211.55.5:6800/schedule.json -d project=douban -d spider=top250
5.停止爬蟲(chóng)
curl http://ip:6800/cancel.json -d project=項(xiàng)目名 -d job=任務(wù)的id值
curl http://10.211.55.5:6800/cancel.json -d project=douban -d job=121cc034388a11ebb1a7001c42d0a249
注意
- 如果scrapy項(xiàng)目代碼,修改了,只需要重新發(fā)布到scrapyd所在服務(wù)器即可
- 如果scrapy項(xiàng)目暫停了,可以再次通過(guò)
curl
的方式發(fā)送命令讓其“斷點(diǎn)續(xù)爬”
Scrapy項(xiàng)目部署-圖形化操作Gerapy
一,說(shuō)明
Gerapy 是一款國(guó)人開(kāi)發(fā)的爬蟲(chóng)管理軟件(有中文界面)是一個(gè)管理爬蟲(chóng)項(xiàng)目的可視化工具,把項(xiàng)目部署到管理的操作全部變?yōu)榻换ナ?,?shí)現(xiàn)批量部署,更方便控制、管理、實(shí)時(shí)查看結(jié)果。
gerapy和scrapyd的關(guān)系就是,我們可以通過(guò)gerapy中配置scrapyd后,不使用命令,直接通過(guò)圖形化界面開(kāi)啟爬蟲(chóng)。
二,安裝
命令 (安裝在 爬蟲(chóng)代碼 上傳端)
pip install gerapy -i https://pypi.tuna.tsinghua.edu.cn/simple
測(cè)試
三,使用
創(chuàng)建一個(gè)gerapy工作目錄
gerapy init
生成文件夾,如下
創(chuàng)建splite 數(shù)據(jù)庫(kù), 存放部署scrapy 項(xiàng)目版本
gerapy migrate
創(chuàng)建成功之后,用tree命令,查看當(dāng)前的文件列表
創(chuàng)建用戶密碼
啟動(dòng)服務(wù)
gerapy runserver
到此這篇關(guān)于快速部署 Scrapy項(xiàng)目 scrapyd的文章就介紹到這了,更多相關(guān)Scrapy項(xiàng)目 scrapyd內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
解決python mysql insert語(yǔ)句的問(wèn)題
這篇文章主要介紹了解決python mysql insert語(yǔ)句的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03Python中l(wèi)ist列表的賦值方法及遇到問(wèn)題處理
這篇文章主要介紹了Python中l(wèi)ist列表的賦值方法及遇到問(wèn)題處理,記錄在列表list的賦值過(guò)程中遇到的問(wèn)題,并對(duì)列表的拷貝相關(guān)知識(shí)進(jìn)行匯總,需要的朋友可以參考一下2022-03-03Python?數(shù)據(jù)可視化神器Pyecharts繪制圖像練習(xí)
這篇文章主要介紹了Python?數(shù)據(jù)可視化神器Pyecharts繪制圖像練習(xí),繪制的圖形有柱狀圖、餅狀圖、箱型圖、折線圖、雷達(dá)圖等多種圖像,需要的小伙伴可以參考一下2022-02-023個(gè)用于數(shù)據(jù)科學(xué)的頂級(jí)Python庫(kù)
今天小編就為大家分享一篇關(guān)于3個(gè)用于數(shù)據(jù)科學(xué)的頂級(jí)Python庫(kù),小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧2018-09-09Python實(shí)用小技巧之判斷輸入是否為漢字/英文/數(shù)字
這篇文章主要給大家介紹了關(guān)于Python實(shí)用小技巧之判斷輸入是否為漢字/英文/數(shù)字的相關(guān)資料,文中通過(guò)實(shí)例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2023-06-06Django中STATIC_ROOT和STATIC_URL及STATICFILES_DIRS淺析
這篇文章主要給大家介紹了關(guān)于Django中STATIC_ROOT和STATIC_URL及STATICFILES_DIRS的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來(lái)一起看看吧2018-05-05tensorflow實(shí)現(xiàn)從.ckpt文件中讀取任意變量
這篇文章主要介紹了tensorflow實(shí)現(xiàn)從.ckpt文件中讀取任意變量,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05pandas計(jì)數(shù) value_counts()的使用
這篇文章主要介紹了pandas計(jì)數(shù) value_counts()的使用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-06-06