亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Java 根據(jù)網(wǎng)絡(luò)URL獲取該網(wǎng)頁(yè)上面所有的img標(biāo)簽并下載圖片

 更新時(shí)間:2020年11月05日 10:38:00   作者:Marydon  
這篇文章主要介紹了Java 根據(jù)網(wǎng)絡(luò)URL獲取該網(wǎng)頁(yè)上面所有的img標(biāo)簽并下載圖片,幫助大家更好的理解和使用Java,感興趣的朋友可以了解下

說(shuō)明:根據(jù)網(wǎng)絡(luò)URL獲取該網(wǎng)頁(yè)上面所有的img標(biāo)簽并下載符合要求的所有圖片

所需jar包:jsoup.jar

import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.MalformedURLException;
import java.net.URL;
import java.net.URLConnection;
import java.util.ArrayList;
import java.util.List;
import java.util.UUID;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

/**
 * 圖片批量下載工具類
 * @author Marydon
 * @create time 2016-9-3下午2:01:03 
 * @update time 2017年9月30日11:07:02
 * @E-mail:dellshouji@163.com
 */
public class ImgDownloadUtil {

  /**
   * 根據(jù)URL獲取網(wǎng)頁(yè)DOM對(duì)象
   * @param url
   *      網(wǎng)址
   * @return DOM對(duì)象
   */
  public static Document getHtmlDocument(String url) {
    Document document = null;
    URL urlObj = null;
    try {
      // 1.建立網(wǎng)絡(luò)連接
      urlObj = new URL(url);
      // 2.根據(jù)url獲取Document對(duì)象
      document = Jsoup.parse(urlObj, 5000);// 單位:毫秒超時(shí)時(shí)間

    } catch (MalformedURLException e) {
      System.out.println("世界上最遙遠(yuǎn)的距離就是沒(méi)有網(wǎng),檢查設(shè)置!");
      e.printStackTrace();
    } catch (IOException e) {
      System.out.println("您的網(wǎng)絡(luò)連接打開(kāi)失敗,請(qǐng)稍后重試!");
      e.printStackTrace();
    }

    return document;
  }

  /**
   * 根據(jù)URL獲取網(wǎng)頁(yè)源碼
   * @param url
   *      網(wǎng)址
   * @return 網(wǎng)頁(yè)源碼
   */
  public static String getHtmlText(String url) {
    String htmlText = "";
    Document document = null;
    URL urlObj = null;
    try {
      // 1.建立網(wǎng)絡(luò)連接
      urlObj = new URL(url);
      // 2.根據(jù)url獲取Document對(duì)象
      document = Jsoup.parse(urlObj, 5000);// 單位:毫秒超時(shí)時(shí)間
      // 3.根據(jù)dom對(duì)象獲取網(wǎng)頁(yè)源碼
      htmlText = document.html();
    } catch (MalformedURLException e) {
      System.out.println("世界上最遙遠(yuǎn)的距離就是沒(méi)有網(wǎng),檢查設(shè)置!");
      e.printStackTrace();
    } catch (IOException e) {
      System.out.println("您的網(wǎng)絡(luò)連接打開(kāi)失敗,請(qǐng)稍后重試!");
      e.printStackTrace();
    }

    return htmlText;
  }

  /**
   * 操作Dom對(duì)象獲取圖片地址
   * @param document
   *      Dom對(duì)象
   * @return 圖片地址集合
   */
  public static List<String> getImgAddressByDom(Document document) {
    // 用于存儲(chǔ)圖片地址
    List<String> imgAddress = new ArrayList<String>();
    if (null != document) {
      // <img src="" alt="" width="" height=""/>
      // 獲取頁(yè)面上所有的圖片元素
      Elements elements = document.getElementsByTag("img");
      String imgSrc = "";
      // 迭代獲取圖片地址
      for (Element el : elements) {
        imgSrc = el.attr("src");
        // imgSrc的內(nèi)容不為空,并且以http://開(kāi)頭
        if ((!imgSrc.isEmpty()) && imgSrc.startsWith("http://")) {
          // 將有效圖片地址添加到List中
          imgAddress.add(imgSrc);
        }
      }
    }

    return imgAddress;
  }

  /**
   * 根據(jù)網(wǎng)絡(luò)URL下載文件
   * @param url
   *      文件所在地址
   * @param fileName
   *      指定下載后該文件的名字
   * @param savePath
   *      文件保存根路徑
   */
  public static void downloadFileByUrl(String url, String fileName, String savePath) {
    URL urlObj = null;
    URLConnection conn = null;
    InputStream inputStream = null;
    BufferedInputStream bis = null;
    OutputStream outputStream = null;
    BufferedOutputStream bos = null;
    try {
      // 1.建立網(wǎng)絡(luò)連接
      urlObj = new URL(url);
      // 2.打開(kāi)網(wǎng)絡(luò)連接
      conn = urlObj.openConnection();
      // 設(shè)置超時(shí)間為3秒
      conn.setConnectTimeout(3 * 1000);
      // 防止屏蔽程序抓取而返回403錯(cuò)誤
      conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
      // 3.得到輸入流
      inputStream = conn.getInputStream();
      bis = new BufferedInputStream(inputStream);

      // 文件保存位置
      File saveDir = new File(savePath);
      if (!saveDir.exists()) {
        saveDir.mkdirs();
      }
      // 文件的絕對(duì)路徑
      String filePath = savePath + File.separator + fileName;
      File file = new File(filePath);
      // 4.
      outputStream = new FileOutputStream(file);
      bos = new BufferedOutputStream(outputStream);
      byte[] b = new byte[1024];
      int len = 0;
      while ((len = bis.read(b)) != -1) {
        bos.write(b, 0, len);
      }
      System.out.println("info:" + url + " download success,fileRename=" + fileName);
    } catch (MalformedURLException e) {
      System.out.println("世界上最遙遠(yuǎn)的距離就是沒(méi)有網(wǎng),檢查設(shè)置");
      System.out.println("info:" + url + " download failure");
      e.printStackTrace();
    } catch (IOException e) {
      System.out.println("您的網(wǎng)絡(luò)連接打開(kāi)失敗,請(qǐng)稍后重試!");
      System.out.println("info:" + url + " download failure");
      e.printStackTrace();
    } finally {// 關(guān)閉流
      try {
        if (bis != null) {// 關(guān)閉字節(jié)緩沖輸入流
          bis.close();
        }

        if (inputStream != null) {// 關(guān)閉字節(jié)輸入流
          inputStream.close();
        }
        if (bos != null) {// 關(guān)閉字節(jié)緩沖輸出流
          bos.close();
        }
        if (outputStream != null) {// 關(guān)閉字節(jié)輸出流
          outputStream.close();
        }

      } catch (IOException e) {
        e.printStackTrace();
      }
    }
  }

}

測(cè)試

public static void main(String[] args) {
  // 1.確定網(wǎng)址
  String url = "http://www.cnblogs.com/Marydon20170307/p/7402871.html";
  // 2.獲取該網(wǎng)頁(yè)的Dom對(duì)象
  Document document = getHtmlDocument(url);
  // 3.獲取該網(wǎng)頁(yè)所有符合要求的圖片地址
  List<String> imgAddresses = getImgAddressByDom(document);
  String imgName = "";
  String imgType = "";
  // 4.設(shè)置圖片保存路徑
  String savePath = "C:/Users/Marydon/Desktop";
  // 5.批量下載圖片
  for (String imgSrc : imgAddresses) {
    // 5.1圖片命名:圖片名用32位字符組成的唯一標(biāo)識(shí)
    imgName = UUID.randomUUID().toString().replace("-", "");
    // 5.2圖片格式(類型)
    imgType = imgSrc.substring(imgSrc.lastIndexOf("."));
    imgName += imgType;
    // 5.3下載該圖片
    downloadFileByUrl(imgSrc, imgName, savePath);
  }
}

以上就是Java 根據(jù)網(wǎng)絡(luò)URL獲取該網(wǎng)頁(yè)上面所有的img標(biāo)簽并下載圖片的詳細(xì)內(nèi)容,更多關(guān)于java 下載網(wǎng)絡(luò)圖片的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • Java簡(jiǎn)單實(shí)現(xiàn)線程池

    Java簡(jiǎn)單實(shí)現(xiàn)線程池

    這篇文章主要為大家詳細(xì)介紹了Java簡(jiǎn)單實(shí)現(xiàn)線程池,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-04-04
  • 如何利用Ganymed SSH-2模擬SSH操作

    如何利用Ganymed SSH-2模擬SSH操作

    這幾天看SFTP資料時(shí),無(wú)意中看到了Ganymed SSH-2,寫了個(gè)簡(jiǎn)單demo,通過(guò),感覺(jué)挺好用的,下面就和大家分享下。需要的朋友可以過(guò)來(lái)參考參考
    2013-08-08
  • 使用Mybatis實(shí)現(xiàn)分頁(yè)效果示例

    使用Mybatis實(shí)現(xiàn)分頁(yè)效果示例

    大家好,本篇文章主要講的是使用Mybatis實(shí)現(xiàn)分頁(yè)效果示例,感興趣的同學(xué)趕快來(lái)看一看吧,對(duì)你有幫助的話記得收藏一下,方便下次瀏覽
    2021-12-12
  • 詳解SpringBoot Schedule配置

    詳解SpringBoot Schedule配置

    本篇文章主要介紹了詳解SpringBoot Schedule配置 ,可以實(shí)現(xiàn)定時(shí)任務(wù),小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧
    2017-03-03
  • 解決使用@ManyToMany查詢數(shù)據(jù)時(shí)的死循環(huán)問(wèn)題

    解決使用@ManyToMany查詢數(shù)據(jù)時(shí)的死循環(huán)問(wèn)題

    這篇文章主要介紹了解決使用@ManyToMany查詢數(shù)據(jù)時(shí)的死循環(huán)問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2021-12-12
  • 一文詳細(xì)解析Java?8?Stream?API中的flatMap方法

    一文詳細(xì)解析Java?8?Stream?API中的flatMap方法

    這篇文章主要介紹了Java?8?Stream?API中的flatMap方法的相關(guān)資料,flatMap方法是Java?StreamAPI中的重要中間操作,用于將流中的每個(gè)元素轉(zhuǎn)換為一個(gè)新的流,并將多個(gè)流合并為一個(gè)單一的流,常用于處理嵌套集合和一對(duì)多映射,需要的朋友可以參考下
    2024-12-12
  • Java異?;A(chǔ)知識(shí)解析

    Java異?;A(chǔ)知識(shí)解析

    這篇文章主要介紹了Java異?;A(chǔ)知識(shí)解析,具有一定借鑒價(jià)值,需要的朋友可以資參考下。
    2017-12-12
  • 實(shí)戰(zhàn)講解Maven安裝及基本使用詳解

    實(shí)戰(zhàn)講解Maven安裝及基本使用詳解

    這篇文章主要介紹了實(shí)戰(zhàn)講解Maven安裝及基本使用詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2020-10-10
  • Java分布式鎖的概念與實(shí)現(xiàn)方式詳解

    Java分布式鎖的概念與實(shí)現(xiàn)方式詳解

    今天小編就為大家分享一篇關(guān)于Java分布式鎖的概念與實(shí)現(xiàn)方式詳解,小編覺(jué)得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來(lái)看看吧
    2019-01-01
  • 詳解JVM的分代模型

    詳解JVM的分代模型

    這篇文章主要介紹了JVM的分代模型的相關(guān)資料,幫助大家更好的理解和學(xué)習(xí)Java虛擬機(jī)相關(guān)知識(shí),感興趣的朋友可以了解下
    2020-10-10

最新評(píng)論