快捷導(dǎo)航

如何在django中運(yùn)行scrapy框架

更新時(shí)間：2020年04月22日 14:20:05 作者：小陸同學(xué)

這篇文章主要介紹了如何在django中運(yùn)行scrapy框架,文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

1.新建一個(gè)django項(xiàng)目，

2.前端展示一個(gè)按鈕

<form action="/start/" method="POST">
    {% csrf_token %}
    <input type="submit" value="啟動(dòng)爬蟲">
</form>

3.在django項(xiàng)目的根目錄創(chuàng)建scrapy項(xiàng)目

4.cmd命令行運(yùn)行：scrapyd 啟動(dòng)服務(wù)

5.將scrapy項(xiàng)目部署到當(dāng)前工程：scrapyd-deploy 爬蟲名稱 -p 項(xiàng)目名稱

6.views.py

# 首頁(yè)
def index(request):
  return render(request,'index.html',locals())

def start(request):
  if request.method == 'POST':
    # 啟動(dòng)爬蟲
    url = 'http://localhost:6800/schedule.json'
    data = {'project': 'ABCkg', 'spider': 'abckg'}
    print(requests.post(url=url, data=data))
    return JsonResponse({'result':'ok'})

7.在本地6800端口點(diǎn)擊jobs當(dāng)前爬蟲項(xiàng)目就在運(yùn)行了。

8.寫一個(gè)按鈕，點(diǎn)擊停止scrapy爬蟲

def stop(request):
  if request.method == 'POST':
    # 停止爬蟲
    url = 'http://127.0.0.1:6800/cancel.json'
    data={"project":'ABCkg','job':'b7fe64ee7ad711e9b711005056c00008'}
    print(requests.post(url=url, data=data))
    return JsonResponse({'result':'stop'})

總結(jié)：

----------------scrapyd 管理----------------------

1、獲取狀態(tài)

http://127.0.0.1:6800/daemonstatus.json

2、獲取項(xiàng)目列表

http://127.0.0.1:6800/listprojects.json

3、獲取項(xiàng)目下已發(fā)布的爬蟲列表

http://127.0.0.1:6800/listspiders.json?project=myproject

4、獲取項(xiàng)目下已發(fā)布的爬蟲版本列表

http://127.0.0.1:6800/listversions.json?project=myproject

5、獲取爬蟲運(yùn)行狀態(tài)

http://127.0.0.1:6800/listjobs.json?project=myproject

6、啟動(dòng)服務(wù)器上某一爬蟲（必須是已發(fā)布到服務(wù)器的爬蟲)

http://localhost:6800/schedule.json

(post方式，data={"project":myproject,"spider":myspider}）

7、刪除某一版本爬蟲

http://127.0.0.1:6800/delversion.json -d project=項(xiàng)目名 -d versions

(post方式，data={"project":myproject,"version":myversion}）

8、刪除某一工程，包括該工程下的各版本爬蟲

http://127.0.0.1:6800/delproject.json

(post方式，data={"project":myproject}）

9、取消爬蟲

http://127.0.0.1:6800/cancel.json

(post方式，data={"project":myproject,'job':myjob}）

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

python 實(shí)現(xiàn)方陣的對(duì)角線遍歷示例
今天小編就為大家分享一篇python 實(shí)現(xiàn)方陣的對(duì)角線遍歷示例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2019-11-11
tensorflow 實(shí)現(xiàn)自定義layer并添加到計(jì)算圖中
今天小編就為大家分享一篇tensorflow 實(shí)現(xiàn)自定義layer并添加到計(jì)算圖中，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2020-02-02
Python反爬蟲偽裝瀏覽器進(jìn)行爬蟲
這篇文章主要介紹了Python反爬蟲偽裝瀏覽器進(jìn)行爬蟲,文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2020-02-02
淺談在django中使用filter()(即對(duì)QuerySet操作)時(shí)踩的坑
這篇文章主要介紹了淺談在django中使用filter()(即對(duì)QuerySet操作)時(shí)踩的坑，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2020-03-03
Python 正則表達(dá)式中re.group()使用小結(jié)
正則表達(dá)式是在處理字符串時(shí)非常有用的工具,而re.group()是在匹配到的文本中提取特定分組內(nèi)容的方法之一,這篇文章主要介紹了Python 正則表達(dá)式之re.group()用法,需要的朋友可以參考下
2024-01-01
Python實(shí)現(xiàn)Smtplib發(fā)送帶有各種附件的郵件實(shí)例
本篇文章主要介紹了Python實(shí)現(xiàn)Smtplib發(fā)送帶有各種附件的郵件實(shí)例，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2017-06-06
10招！看骨灰級(jí)Pythoner玩轉(zhuǎn)Python的方法
這篇文章主要介紹了10招！看骨灰級(jí)Pythoner如何玩轉(zhuǎn)Python,需要的朋友可以參考下
2019-04-04
PyQt5 designer 頁(yè)面點(diǎn)擊按鈕跳轉(zhuǎn)頁(yè)面實(shí)現(xiàn)
本文主要介紹了PyQt5 designer 頁(yè)面點(diǎn)擊按鈕跳轉(zhuǎn)頁(yè)面實(shí)現(xiàn)，文中通過示例代碼介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2022-01-01
python神經(jīng)網(wǎng)絡(luò)AlexNet分類模型訓(xùn)練貓狗數(shù)據(jù)集
這篇文章主要為大家介紹了python神經(jīng)網(wǎng)絡(luò)AlexNet分類模型訓(xùn)練貓狗數(shù)據(jù)集，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步，早日升職加薪
2022-05-05
python之pil的使用詳解
Pillow是PIL的一個(gè)派生分支，但如今已經(jīng)發(fā)展成為比PIL本身更具活力的圖像處理庫(kù)。我們需要安裝的就是Pillow。這篇文章主要介紹了python之pil的使用,需要的朋友可以參考下
2021-10-10