亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

python3.4爬蟲demo

 更新時間:2019年01月22日 10:27:15   作者:chenqiangdage  
今天小編就為大家分享一篇關(guān)于python3.4爬蟲demo,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧

python 3.4 所寫爬蟲

僅僅是個demo,以百度圖片首頁圖片為例。能跑出圖片上的圖片;

使用 eclipse pydev 編寫:

from SpiderSimple.HtmLHelper import *
import imp
import sys
imp.reload(sys) 
#sys.setdefaultencoding('utf-8')  
html = getHtml('http://image.baidu.com/')
try:
  getImage(html)
  exit()
except Exception as e:
  print(e) 

HtmlHelper.py文件 

上面的 SpiderSimple是自定義的包名

from urllib.request import urlopen,urlretrieve
#正則庫
import re
#打開網(wǎng)頁
def getHtml(url):
  page = urlopen(url)        
  html = page.read()
  return html
#用正則爬里面的圖片地址  
def getImage(Html):
  try:
    #reg = r'src="(.+?\.jpg)" class'
    #image = re.compile(reg)  
    image = re.compile(r'<img[^>]*src[=\"\']+([^\"\']*)[\"\'][^>]*>', re.I)     
    Html = Html.decode('utf-8')
    imaglist = re.findall(image,Html)    
    x =0    
    for imagurl in imaglist:  
      #將圖片一個個下載到項目所在文件夾     
      urlretrieve(imagurl, '%s.jpg' % x)
      x+=1 
  except Exception as e:
    print(e)

要注意個大問題,python 默認編碼的問題。

有可能報UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128),錯誤。這個要設(shè)置python的默認編碼為utf-8.

設(shè)置最好的方式是寫bat文件,

echo off
set PYTHONIOENCODING=utf8
python -u %1

然后重啟電腦。

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接

相關(guān)文章

  • pycharm配置QtDesigner的超詳細方法

    pycharm配置QtDesigner的超詳細方法

    這篇文章主要介紹了pycharm配置QtDesigner的超詳細方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2021-01-01
  • Python如何使用字符打印照片

    Python如何使用字符打印照片

    這篇文章主要介紹了Python如何使用字符打印照片,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
    2020-01-01
  • Python中的Pandas庫操作小結(jié)

    Python中的Pandas庫操作小結(jié)

    Pandas 是一個用于數(shù)據(jù)分析的 Python 第三方庫,能夠處理和分析不同格式的數(shù)據(jù),Pandas 提供了兩種數(shù)據(jù)結(jié)構(gòu),分別為 Series 和 DataFrame,靈活而方便地進行數(shù)據(jù)分析和操作,本文通過實例代碼給大家介紹的非常詳細,需要的朋友參考下吧
    2023-06-06
  • 使用PyInstaller將Python代碼打包成獨立可執(zhí)行文件詳細步驟

    使用PyInstaller將Python代碼打包成獨立可執(zhí)行文件詳細步驟

    PyInstaller是一個Python庫,可以將Python應(yīng)用程序轉(zhuǎn)換為獨立的可執(zhí)行文件,這篇文章主要給大家介紹了關(guān)于使用PyInstaller將Python代碼打包成獨立可執(zhí)行文件的詳細步驟,需要的朋友可以參考下
    2024-07-07
  • Python實現(xiàn)重建二叉樹的三種方法詳解

    Python實現(xiàn)重建二叉樹的三種方法詳解

    這篇文章主要介紹了Python實現(xiàn)重建二叉樹的三種方法,結(jié)合實例形式分析了Python重建二叉樹的實現(xiàn)方法、操作技巧與注意事項,需要的朋友可以參考下
    2018-06-06
  • Python輕量級定時任務(wù)調(diào)度APScheduler的使用

    Python輕量級定時任務(wù)調(diào)度APScheduler的使用

    Apscheduler是一個基于Quartz的python定時任務(wù)框架,本文主要介紹了Python輕量級定時任務(wù)調(diào)度APScheduler的使用,具有一定的參考價值,感興趣的可以了解一下
    2024-02-02
  • 使用Python3編寫抓取網(wǎng)頁和只抓網(wǎng)頁圖片的腳本

    使用Python3編寫抓取網(wǎng)頁和只抓網(wǎng)頁圖片的腳本

    這篇文章主要介紹了使用Python3編寫抓取網(wǎng)頁和只抓網(wǎng)頁圖片的腳本,使用到了urllib模塊,需要的朋友可以參考下
    2015-08-08
  • 基于Python實現(xiàn)西西成語接龍小助手

    基于Python實現(xiàn)西西成語接龍小助手

    成語接龍是中華民族傳統(tǒng)的文字游戲。本文將用Python制作一個簡單的成語接龍小程序,文中的示例代碼講解詳細,感興趣的小伙伴可以了解一下
    2022-08-08
  • python多線程編程中的join函數(shù)使用心得

    python多線程編程中的join函數(shù)使用心得

    這篇文章主要介紹了python多線程編程中的join函數(shù)使用心得,本文先是給出了join函數(shù)使用例子,并對join函數(shù)的使用作了總結(jié),需要的朋友可以參考下
    2014-09-09
  • 使用Python進行數(shù)據(jù)清洗和預處理的實現(xiàn)代碼

    使用Python進行數(shù)據(jù)清洗和預處理的實現(xiàn)代碼

    Python作為數(shù)據(jù)科學領(lǐng)域的熱門編程語言,提供了豐富的庫和工具來處理和清洗數(shù)據(jù),本文將介紹如何使用Python進行數(shù)據(jù)清洗和預處理,并提供相應(yīng)的代碼示例,需要的朋友可以參考下
    2024-05-05

最新評論