Java 必知必會(huì)的 URL 和 URLConnection使用
java.net.URL 類(lèi)將 URL 地址進(jìn)行了封裝,并提供了解析 URL 地址的基本方法,比如獲取 URL 的主機(jī)名和端口號(hào)。
java.net.URLConnection 則代表了應(yīng)用程序和 URL 之間的通信鏈接,可用于讀取和寫(xiě)入此 URL 引用的資源。
URLConnection 看起來(lái)只是比 URL 多了一個(gè) Connection,它們之間的關(guān)系也僅限于此嗎?
01、什么是 URL
為了搞清楚什么是 URL,需要引入另外兩個(gè)概念 URI 和 URN。
什么鬼,URL 都沒(méi)搞清楚,又來(lái)兩個(gè)搞不清楚的?別擔(dān)心,我能像變了魔法一樣讓大家把三個(gè)都搞清楚。
- URI = Universal Resource Identifier,中文釋義為統(tǒng)一資源標(biāo)志符
- URL = Universal Resource Locator,中文釋義為統(tǒng)一資源定位符
- URN = Universal Resource Name,中文釋義為統(tǒng)一資源名稱(chēng)
它們之間的關(guān)系如下圖所示:
這圖啥意思啊,怎么辦呢?張小敬有問(wèn)題就去問(wèn)葛佬,咱不會(huì)就去問(wèn)“維基百科”啊。
URI 可以分為 URL 和 URN,或者是 URL 和 URN 的結(jié)合體(同時(shí)具備 Locator 和 Name)。URN 就好像一個(gè)人的名字,URL 就像一個(gè)人的地址。換句話(huà)說(shuō):URN 確定了身份,URL 提供了找到它的方式。
概念清晰了吧?URI 是一個(gè)純粹的句法結(jié)構(gòu),用于指定標(biāo)識(shí) Web 資源的字符串的各個(gè)不同部分。URL 是 URI 的一個(gè)特例,包含了定位 Web 資源的足夠多的信息。URI 是統(tǒng)一資源標(biāo)識(shí)符,而 URL 是統(tǒng)一資源定位符。URL 是 URI 的一種,比如:http://www.itmind.net/。但不是所有的 URI 都是 URL,因?yàn)?URI 可能包括一個(gè)子集,即統(tǒng)一資源名稱(chēng) (URN,命名了資源但不指定如何定位資源),比如說(shuō):mailto:qing_gee@163.com。
吧啦吧啦說(shuō)這么多挺累的,來(lái)一發(fā)實(shí)例吧,用于獲取 URL 的主機(jī)名和端口號(hào)。
URL url = new URL("http://www.itmind.net/category/payment-selection/zhishixingqiu-jingxuan/"); System.out.println("host: " + url.getHost()); System.out.println("port: " + url.getPort()); System.out.println("uri_path: " + url.getPath()); // 輸出 // host: www.itmind.net // port: -1 // uri_path: /category/payment-selection/zhishixingqiu-jingxuan/
1)創(chuàng)建 java.net.URL 對(duì)象的方法非常簡(jiǎn)單,只需要一行代碼。
URL url = new URL(URL地址);
URL 對(duì)象是不可變的,因?yàn)?URL 類(lèi)是 final 類(lèi)型的,這樣的好處就是保證它是"線(xiàn)程安全"的。
2)有了 java.net.URL 對(duì)象后,就可以獲取 URL 相關(guān)的主機(jī)名、端口、路徑等等。
url.getHost() url.getPort() url.getPath()
02、什么是 URLConnection
URLConnection 是一個(gè)抽象類(lèi),代表應(yīng)用程序和 URL 之間的通信鏈接。它的實(shí)例可用于讀取和寫(xiě)入此 URL 引用的資源。該類(lèi)提供了比 Socket 類(lèi)更易于使用、更高級(jí)的網(wǎng)絡(luò)連接抽象。
怎么獲取 URLConnection 對(duì)象呢?通過(guò) URL 對(duì)象的 openConnection() 方法,示例如下。
URL url = new URL("http://www.itmind.net"); URLConnection connection = url.openConnection();
如果 URL 協(xié)議為 HTTP 的話(huà),返回的連接為 URLConnection 的子類(lèi) HttpURLConnection。
有了 URLConnection 對(duì)象后,可以通過(guò) getInputStream() 返回一個(gè) InputStream,由此讀取 URL 所引用的資源數(shù)據(jù)(如果讀取 ASCII 文本則為 ASCII;如果讀取 HTML 文件則為原始 HTML,如果讀取圖像文件則為二進(jìn)制圖片數(shù)據(jù)等)。
我們來(lái)嘗試讀取一下小白學(xué)堂首頁(yè)的內(nèi)容,代碼示例如下。
URL url = new URL("http://www.itmind.net"); URLConnection connection = url.openConnection(); try (InputStream in = connection.getInputStream();) { ByteArrayOutputStream output = new ByteArrayOutputStream(); byte[] buffer = new byte[1024]; int len = -1; while ((len = in.read(buffer)) != -1) { output.write(buffer, 0, len); } System.out.println(new String(output.toByteArray())); } catch (IOException e) { e.printStackTrace(); }
可以使用 try-with-resource 獲取 InputStream,該類(lèi)實(shí)現(xiàn)了 AutoCloseable 接口,可以在內(nèi)容讀取完畢后自動(dòng)關(guān)閉輸入流。
打印的內(nèi)容如下圖所示(部分):
如果你想讀取某個(gè) URL 的內(nèi)容,上述方法是一個(gè)不錯(cuò)的方案,趕快去試試吧!
03、URL 和 URLConnection 的不同
URL 和 URLConnection 最大的不同在于:
- URLConnection 提供了對(duì) HTTP 頭部的訪(fǎng)問(wèn);
- URLConnection 可以配置發(fā)送給某個(gè) URL 的請(qǐng)求參數(shù);
- URLConnection 不僅可以讀取 URL 定位的資源,還可以向其寫(xiě)入數(shù)據(jù)。
獲取 HTTP 頭部的方法有以下一些:
- getContentType,返回 Content-type 頭字段的值,即數(shù)據(jù)的 MIME 內(nèi)容類(lèi)型。若類(lèi)型不可用,則返回 null。如果內(nèi)容類(lèi)型是文本,則 Content-type 首部可能會(huì)包含一個(gè)標(biāo)識(shí)內(nèi)容編碼方式的字符集,例如:Content-type:text/html; charset=UTF-8
- getContentLength(),返回 Content-length 頭字段的值,即內(nèi)容的字節(jié)數(shù)。
- getContentEncoding(),返回 Content-encoding 頭字段的值,即內(nèi)容的編碼方式(不同于字符編碼方式),例如:x-gzip。
- getDate(),返回 date 頭字段的值,即請(qǐng)求的發(fā)送時(shí)間。
- getExpiration(),返回 expires(過(guò)期時(shí)間) 頭字段的值。如果返回 0,表示不過(guò)期,永遠(yuǎn)緩存。
- getLastModified(),返回 last-modified(上次修改日期) 頭字段的值。
代碼示例如下。
URL url = new URL("http://www.itmind.net"); URLConnection connection = url.openConnection(); System.out.println(connection.getContentType()); System.out.println(connection.getContentLength()); System.out.println(connection.getContentEncoding()); System.out.println(connection.getDate()); System.out.println(connection.getExpiration()); System.out.println(connection.getLastModified()); // 輸出 // text/html; charset=UTF-8 // -1 // null // 1566886980000 // 0 // 0
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Java中Array、List、ArrayList的區(qū)別及說(shuō)明
這篇文章主要介紹了Java中Array、List、ArrayList的區(qū)別及說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-07-07@CacheEvict中的allEntries與beforeInvocation的區(qū)別說(shuō)明
這篇文章主要介紹了@CacheEvict中的allEntries與beforeInvocation的區(qū)別說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-12-12SpringBoot四大神器之Auto onfiguration的使用
本文主要介紹了SpringBoot四大神器之Auto Configuration,springboot auto configuration的本質(zhì)就是自動(dòng)配置spring的各種bean。感興趣的可以了解一下2021-10-10使用Jenkins來(lái)構(gòu)建SVN+Maven項(xiàng)目的實(shí)現(xiàn)
這篇文章主要介紹了使用Jenkins來(lái)構(gòu)建SVN+Maven項(xiàng)目的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09springboot實(shí)現(xiàn)注冊(cè)加密與登錄解密功能(demo)
這篇文章主要介紹了springboot實(shí)現(xiàn)注冊(cè)的加密與登錄的解密功能,本文通過(guò)demo實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-02-02Java ThreadLocal的設(shè)計(jì)理念與作用
這篇文章主要介紹了Java ThreadLocal的設(shè)計(jì)理念與作用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-03-03