亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

CSS選擇器實現字段解析

  發(fā)布時間:2018-01-31 16:21:05   作者:佚名   我要評論
這篇文章主要介紹了CSS選擇器實現字段解析的相關資料,需要的朋友可以參考下

根據上面所學的CSS基礎語法知識,現在來實現字段的解析。首先還是解析標題。打開網頁開發(fā)者工具,找到標題所對應的源代碼。

發(fā)現是在div class="entry-header"下面的h1節(jié)點中,于是打開scrapy shell 進行調試

但是我不想要<h1>這種標簽該咋辦,這時候就要使用CSS選擇器中的偽類方法。如下所示。

注意的是兩個冒號。使用CSS選擇器真的很方便。同理我用CSS實現字段解析。代碼如下

# -*- coding: utf-8 -*-  
import scrapy  
import re  
class JobboleSpider(scrapy.Spider):  
    name = 'jobbole'  
    allowed_domains = ['blog.jobbole.com']  
    start_urls = ['http://blog.jobbole.com/113549/']  
    def parse(self, response):  
        # title = response.xpath('//div[@class = "entry-header"]/h1/text()').extract()[0]  
        # create_date = response.xpath("//p[@class = 'entry-meta-hide-on-mobile']/text()").extract()[0].strip().replace("·","").strip()  
        # praise_numbers = response.xpath("//span[contains(@class,'vote-post-up')]/h10/text()").extract()[0]  
        # fav_nums = response.xpath("//span[contains(@class,'bookmark-btn')]/text()").extract()[0]  
        # match_re = re.match(".*?(\d+).*",fav_nums)  
        # if match_re:  
        #     fav_nums = match_re.group(1)  
        # comment_nums = response.xpath("//a[@href='#article-comment']/span").extract()[0]  
        # match_re = re.match(".*?(\d+).*", comment_nums)  
        # if match_re:  
        #     comment_nums = match_re.group(1)  
        # content = response.xpath("//div[@class='entry']").extract()[0]  
#通過CSS選擇器提取字段  
        title = response.css(".entry-header h1::text").extract()[0]  
        create_date = response.css(".entry-meta-hide-on-mobile::text").extract()[0].strip().replace("·","").strip()  
        praise_numbers = response.css(".vote-post-up h10::text").extract()[0]  
        fav_nums = response.css("span.bookmark-btn::text").extract()[0]  
        match_re = re.match(".*?(\d+).*", fav_nums)  
        if match_re:  
            fav_nums = match_re.group(1)  
        comment_nums = response.css("a[href='#article-comment'] span::text").extract()[0]  
        match_re = re.match(".*?(\d+).*", comment_nums)  
        if match_re:  
            comment_nums = match_re.group(1)  
        content = response.css("div.entry").extract()[0]  
        tags = response.css("p.entry-meta-hide-on-mobile a::text").extract()[0]  
        pass  

總結

以上所述是小編給大家介紹的CSS選擇器實現字段解析,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!

相關文章

  • CSS :visited偽類選擇器隱秘往事回憶錄

    這篇文章主要介紹了CSS :visited偽類選擇器隱秘往事回憶錄,需要的朋友可以參考下
    2018-10-12
  • dw中css選擇器nthchild怎么使用?

    dw中css選擇器nthchild怎么使用?Dreamweaver中出現了多個相同的標簽,這時候可以使用nth-child()選擇器,下面我們就來看看詳細的教程,需要的朋友可以參考下
    2018-06-04
  • css選擇器中有小數點的標簽獲取方法

    這篇文章主要介紹了css選擇器中有小數點的標簽獲取方法,需要的朋友可以參考下
    2018-03-26
  • CSS3 :default偽類選擇器使用簡介

    CSS3 :default 偽類選擇器只能作用在表單元素上,表示默認狀態(tài)的表單元素。接下來通過本文給大家介紹CSS3 :default偽類選擇器使用簡介,感興趣的朋友跟隨腳本之家小編一起
    2018-03-15
  • CSS選擇器的新用法(推薦)

    本文將詳細介紹CSS選擇器的新用法,感興趣的朋友一起學習吧
    2018-02-02
  • CSS中選擇器的權重值的計算

    這篇文章主要介紹了CSS中選擇器的權重值的計算的相關資料,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-01-23
  • Dreamweaver中css選擇器中的類怎么使用?

    Dreamweaver怎么使用css選擇器中的類?Dreamweaver中css選擇器中有很多功能,想要使用其中的類,該怎么使用呢?下面我們就來看看詳細的教程,需要的朋友可以參考下
    2018-01-09
  • 詳解CSS3選擇器:nth-child和:nth-of-type之間的差異

    本篇文章主要介紹了CSS3選擇器:nth-child和:nth-of-type之間的差異,非常具有實用價值,需要的朋友可以參考下
    2017-09-18
  • 總結30個CSS3選擇器

    本文總結了30個CSS3選擇器,小編覺得挺不錯的,現在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-04-13
  • css3類選擇器之結合元素選擇器和多類選擇器用法

    這篇文章主要介紹了css3類選擇器之結合元素選擇器和多類選擇器用法,非常不錯,具有參考借鑒價值,需要的朋友可以參考下
    2017-03-09

最新評論