使用Python的Scrapy框架十分鐘爬取美女圖
簡介
scrapy 是一個 python 下面功能豐富、使用快捷方便的爬蟲框架。用 scrapy 可以快速的開發(fā)一個簡單的爬蟲,官方給出的一個簡單例子足以證明其強大:
快速開發(fā)
下面開始10分鐘倒計時:
當然開始前,可以先看看之前我們寫過的 scrapy 入門文章 《零基礎寫python爬蟲之使用Scrapy框架編寫爬蟲
1. 初始化項目
scrapy startproject mzt cd mzt scrapy genspider meizitu meizitu.com
2. 添加 spider 代碼:
定義 scrapy.Item ,添加 image_urls 和 images ,為下載圖片做準備。
修改 start_urls 為初始頁面, 添加 parse 用于處理列表頁, 添加 parse_item 處理項目頁面。
3. 修改配置文件:
DOWNLOAD_DELAY = 1 # 添加下載延遲配置 ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1} # 添加圖片下載 pipeline IMAGES_STORE = '.' # 設置圖片保存目錄
4. 運行項目:
scrapy crawl meizitu
看,項目運行效果圖
等待一會兒,就是收獲的時候了
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作能帶來一定的幫助,如果有疑問大家可以留言交流。
相關文章
pycharm配置pyqt5-tools開發(fā)環(huán)境的方法步驟
這篇文章主要介紹了pycharm配置pyqt5-tools開發(fā)環(huán)境的方法步驟,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-02-02python導出requirements.txt的幾種方法以及環(huán)境配置詳細流程
這篇文章主要給大家介紹了關于python導出requirements.txt的幾種方法以及環(huán)境配置詳細流程,requirements.txt 文件是一個文本文件,用于列出你的Python項目所依賴的軟件包及其版本,需要的朋友可以參考下2023-11-11python Django編寫接口并用Jmeter測試的方法
這篇文章主要介紹了python Django編寫接口并用Jmeter測試,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-07-07