腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

軟件下載

android MAC 驅(qū)動(dòng)下載字體下載 DLL

源碼下載

PHP ASP.NET ASP JSP

軟件編程

C# JAVA C 語(yǔ)言 Delphi Android

網(wǎng)絡(luò)編程

PHP ASP.NET ASP JavaScript

在線工具

CSS格式化 JS格式化 Html轉(zhuǎn)化為Js

數(shù)據(jù)庫(kù)

MYSQL MSSQL oracle DB2 MARIADB

CMS

PHPCMS DEDECMS 帝國(guó)CMS WordPress

常用工具

PHP開(kāi)發(fā)工具 python Photoshop 必備軟件

Python使用urllib2模塊抓取HTML頁(yè)面資源的實(shí)例分享

更新時(shí)間：2016年05月03日 17:58:27 作者：larry

這篇文章主要介紹了Python使用urllib2模塊抓取HTML頁(yè)面資源的實(shí)例分享,將要抓取的頁(yè)面地址寫(xiě)在單獨(dú)的規(guī)則列表中方便組織和重復(fù)使用,需要的朋友可以參考下

先把要抓取的網(wǎng)絡(luò)地址列在單獨(dú)的list文件中

http://chabaoo.cn/article/83440.html
http://chabaoo.cn/article/83437.html
http://chabaoo.cn/article/83430.html
http://chabaoo.cn/article/83449.html

然后我們來(lái)看程序操作，代碼如下：

#!/usr/bin/python

import os
import sys
import urllib2
import re

def Cdown_data(fileurl, fpath, dpath):
 if not os.path.exists(dpath):
  os.makedirs(dpath)
 try:
  getfile = urllib2.urlopen(fileurl) 
  data = getfile.read()
  f = open(fpath, 'w')
  f.write(data)
  f.close()
 except:
 print 

with open('u1.list') as lines:
 for line in lines:
  URI = line.strip()
  if '?' and '%' in URI:
   continue
 elif URI.count('/') == 2:
   continue
  elif URI.count('/') > 2:
   #print URI,URI.count('/')
  try:
    dirpath = URI.rpartition('/')[0].split('//')[1]
    #filepath = URI.split('//')[1].split('/')[1]
    filepath = URI.split('//')[1]
   if filepath:
     print URI,filepath,dirpath
     Cdown_data(URI, filepath, dirpath)
   except:
    print URI,'error'

您可能感興趣的文章:

相關(guān)文章

python中的編碼知識(shí)整理匯總
這篇文章主要介紹了python中的編碼知識(shí)整理匯總的相關(guān)資料,需要的朋友可以參考下
2016-01-01
Python 使用雙重循環(huán)打印圖形菱形操作
這篇文章主要介紹了Python 使用雙重循環(huán)打印圖形菱形操作，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2020-08-08
python-xpath獲取html文檔的部分內(nèi)容
這篇文章主要介紹了python-xpath獲取html文檔的部分內(nèi)容，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2020-03-03
Python實(shí)現(xiàn)照片卡通化
animegan2-pytorch機(jī)器學(xué)習(xí)項(xiàng)目可以實(shí)現(xiàn)照片動(dòng)漫化，本文將為大家詳細(xì)介紹一下如何使用這一項(xiàng)目，感興趣的小伙伴快來(lái)跟隨小編一起學(xué)習(xí)吧
2021-12-12
python中return如何寫(xiě)
在本篇文章里小編給大家分享的是一篇關(guān)于python中return如何寫(xiě)的知識(shí)點(diǎn)總結(jié)，需要的朋友們參考學(xué)習(xí)下。
2020-06-06
python實(shí)現(xiàn)線程池的方法
這篇文章主要介紹了python實(shí)現(xiàn)線程池的方法,實(shí)例分析了Python線程池的原理與相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下
2015-06-06
Python入門(mén)教程(四十三)Python的NumPy數(shù)據(jù)類型
這篇文章主要介紹了Python入門(mén)教程(四十二)Python的NumPy數(shù)組裁切,NumPy有一些額外的數(shù)據(jù)類型，并通過(guò)一個(gè)字符引用數(shù)據(jù)類型，例如 i 代表整數(shù)，u 代表無(wú)符號(hào)整數(shù)等,需要的朋友可以參考下
2023-05-05
基于python繪制科赫雪花
這篇文章主要為大家詳細(xì)介紹了基于python繪制科赫雪花，具有一定的參考價(jià)值，感興趣的小伙伴們可以參考一下
2018-06-06
pandas將DataFrame的列變成行索引的方法
下面小編就為大家分享一篇pandas將DataFrame的列變成行索引的方法，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2018-04-04
Python列表刪除元素del、pop()和remove()的區(qū)別小結(jié)
這篇文章主要給大家介紹了關(guān)于Python列表刪除元素del、pop()和remove()的區(qū)別，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家學(xué)習(xí)或者使用Python具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2019-09-09