亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

基于selenium-java封裝chrome、firefox、phantomjs實(shí)現(xiàn)爬蟲

 更新時(shí)間:2020年10月28日 11:40:05   作者:zhouhao1256  
這篇文章主要介紹了基于selenium-java封裝chrome、firefox、phantomjs實(shí)現(xiàn)爬蟲,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧

2017年一直以來在公司負(fù)責(zé)爬蟲項(xiàng)目相關(guān)工程,主要業(yè)務(wù)有預(yù)定、庫存、在開發(fā)中也遇到很多問題,隨手記錄一下,后續(xù)會(huì)持續(xù)更新。

chrome、firefox、phantomjs插件安裝和版本說明
基于selenium-java封裝chrome、firefox、phantomjs實(shí)現(xiàn)爬蟲

項(xiàng)目下載地址

maven版本說明

  <!-- +++|selenium|+++ -->
    <dependency>
      <groupId>org.seleniumhq.selenium</groupId>
      <artifactId>selenium-java</artifactId>
      <version>3.5.1</version>
    </dependency>
    <!-- +++|phantomjsdriver|+++ -->
    <dependency>
      <groupId>com.github.detro.ghostdriver</groupId>
      <artifactId>phantomjsdriver</artifactId>
      <version>1.1.0</version>
    </dependency>

chrome插件配置

下載地址:chromedriver下載地址選擇本地系統(tǒng)對應(yīng)的chrome版本安裝,工程下面有一個(gè) 對應(yīng)的目錄是:Plugin/chromedriver_win32.zip,對應(yīng)chrmoe版本是Supports Chrome v60-62

直接運(yùn)行項(xiàng)目中示例

public class ChromeTest {
public static void main(String[] args) {
  WebDriver webDriver = null;
  try {
    webDriver = WebDriverUtil.createChromeWebDriver("D:\\webdrvier\\chromedriver.exe");//修改路徑
    webDriver.get("https://www.baidu.com/");
    System.out.println(webDriver.getTitle());
  } catch (Exception e) {
    e.printStackTrace();
  } finally {
    if (webDriver != null) {
      webDriver.close();
    }
  }
}
}

chrome配置插件是最簡單的,linux上面只需要把插件換成linux版本即可

 firefox

下載插件地址:geckodriver下載地址,選擇本地系統(tǒng)對應(yīng)的firefox版本安裝,工程下面有一個(gè) 對應(yīng)的目錄是:Plugin/geckodriver-v0.18.0-win64.zip,對應(yīng)firefox版本是Firefox Setup 50.0(64位)、其他版本沒有測試過

firefox下載地址、selenium-java版本和geckodriver版本更新迭代不一致,導(dǎo)致在搭建環(huán)境時(shí)很容易出現(xiàn)一系列問題。

直接運(yùn)行項(xiàng)目中示例

public class FireFoxTest {
  public static void main(String[] args) {
    WebDriver webDriver = null;
    try {
      webDriver = WebDriverUtil.createFirefoxWebDriver("D:\\webdrvier\\Firefox\\geckodriver_18.exe");
      webDriver.get("https://book.douban.com/tag/");
      Set<String> tagSet = new HashSet<>();
      //獲取豆瓣標(biāo)簽
      List<WebElement> divWebElement = webDriver.findElements(By.cssSelector("#content > div > div.article > div:nth-child(2) > div"));
      for (WebElement webElement : divWebElement) {
        List<WebElement> aWebElement = webElement.findElements(By.cssSelector("a"));
        for (WebElement element : aWebElement) {
          tagSet.add(element.getText());
        }
      }
      System.out.println(tagSet);
      //點(diǎn)擊小說標(biāo)簽
      WebElement webElement = webDriver.findElement(By.cssSelector("#content > div > div.article > div:nth-child(2) > div:nth-child(1) > table > tbody > tr:nth-child(1) > td:nth-child(1) > a"));
      webElement.click();
      System.out.println(webDriver.getTitle());
    } catch (Exception e) {
      e.printStackTrace();
    } finally {
      if (webDriver != null) {
        webDriver.quit();
        webDriver.close();
      }
    }
  }
}

phantomjs

下載插件地址phantomjs插件地址1phantomjs插件地址2、下載有些慢。phantomjs是沒有界面的,所以只需要下載插件即可。

直接運(yùn)行項(xiàng)目中示例

public class PhantomjsTest {
public static void main(String[] args) {
  WebDriver webDriver = null;
  try {
    webDriver = WebDriverUtil.createPhantomjsWebDriver("D:/webdrvier/phantomjs-1.9.8-windows/phantomjs.exe");
    webDriver.get("https://www.baidu.com/");
    System.out.println(webDriver.getTitle());
  } catch (Exception e) {
    e.printStackTrace();
  } finally {
    if (webDriver != null) {
      webDriver.close();
    }
  }
}
}

到此這篇關(guān)于基于selenium-java封裝chrome、firefox、phantomjs實(shí)現(xiàn)爬蟲的文章就介紹到這了,更多相關(guān)selenium java封裝爬蟲內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論