亚洲乱码中文字幕综合,中国熟女仑乱hd,亚洲精品乱拍国产一区二区三区,一本大道卡一卡二卡三乱码全集资源,又粗又黄又硬又爽的免费视频

Java高效讀取大文件實例分析

 更新時間:2018年01月03日 14:59:53   作者:Leesire  
這篇文章主要介紹了Java高效讀取大文件實例分析,具有一定借鑒價值,需要的朋友可以參考下

1、概述

本教程將演示如何用Java高效地讀取大文件。Java——回歸基礎(chǔ)。

2、在內(nèi)存中讀取

讀取文件行的標(biāo)準(zhǔn)方式是在內(nèi)存中讀取,Guava和ApacheCommonsIO都提供了如下所示快速讀取文件行的方法:

Files.readLines(new File(path), Charsets.UTF_8);

FileUtils.readLines(new File(path));

這種方法帶來的問題是文件的所有行都被存放在內(nèi)存中,當(dāng)文件足夠大時很快就會導(dǎo)致程序拋出OutOfMemoryError異常。

例如:讀取一個大約1G的文件:

@Test
public void givenUsingGuava_whenIteratingAFile_thenWorks() throws IOException {
  String path = ...
  Files.readLines(new File(path), Charsets.UTF_8);
}

這種方式開始時只占用很少的內(nèi)存:(大約消耗了0Mb內(nèi)存)

[main] INFO org.baeldung.java.CoreJavaIoUnitTest - Total Memory: 128 Mb
[main] INFO org.baeldung.java.CoreJavaIoUnitTest - Free Memory: 116 Mb

然而,當(dāng)文件全部讀到內(nèi)存中后,我們最后可以看到(大約消耗了2GB內(nèi)存):

[main] INFO org.baeldung.java.CoreJavaIoUnitTest - Total Memory: 2666 Mb
[main] INFO org.baeldung.java.CoreJavaIoUnitTest - Free Memory: 490 Mb

這意味這一過程大約耗費了2.1GB的內(nèi)存——原因很簡單:現(xiàn)在文件的所有行都被存儲在內(nèi)存中。

把文件所有的內(nèi)容都放在內(nèi)存中很快會耗盡可用內(nèi)存——不論實際可用內(nèi)存有多大,這點是顯而易見的。

此外,我們通常不需要把文件的所有行一次性地放入內(nèi)存中——相反,我們只需要遍歷文件的每一行,然后做相應(yīng)的處理,處理完之后把它扔掉。所以,這正是我們將要做的——通過行迭代,而不是把所有行都放在內(nèi)存中。

3、文件流

現(xiàn)在讓我們看下這種解決方案——我們將使用java.util.Scanner類掃描文件的內(nèi)容,一行一行連續(xù)地讀取:

FileInputStream inputStream = null;
Scanner sc = null;
try {
  inputStream = new FileInputStream(path);
  sc = new Scanner(inputStream, "UTF-8");
  while (sc.hasNextLine()) {
    String line = sc.nextLine();
    // System.out.println(line);
  }
  // note that Scanner suppresses exceptions
  if (sc.ioException() != null) {
    throw sc.ioException();
  }
} finally {
  if (inputStream != null) {
    inputStream.close();
  }
  if (sc != null) {
    sc.close();
  }
}

這種方案將會遍歷文件中的所有行——允許對每一行進(jìn)行處理,而不保持對它的引用??傊疀]有把它們存放在內(nèi)存中:(大約消耗了150MB內(nèi)存)

[main]INFOorg.baeldung.java.CoreJavaIoUnitTest-TotalMemory:763Mb

[main]INFOorg.baeldung.java.CoreJavaIoUnitTest-FreeMemory:605Mb

4、ApacheCommonsIO流

同樣也可以使用CommonsIO庫實現(xiàn),利用該庫提供的自定義LineIterator:

LineIterator it = FileUtils.lineIterator(theFile, "UTF-8");
try {
  while (it.hasNext()) {
    String line = it.nextLine();
    // do something with line
  }
} finally {
  LineIterator.closeQuietly(it);
}

由于整個文件不是全部存放在內(nèi)存中,這也就導(dǎo)致相當(dāng)保守的內(nèi)存消耗:(大約消耗了150MB內(nèi)存)

[main]INFOo.b.java.CoreJavaIoIntegrationTest-TotalMemory:752Mb

[main]INFOo.b.java.CoreJavaIoIntegrationTest-FreeMemory:564Mb

5、結(jié)論

這篇短文介紹了如何在不重復(fù)讀取與不耗盡內(nèi)存的情況下處理大文件——這為大文件的處理提供了一個有用的解決辦法。

所有這些例子的實現(xiàn)和代碼片段都可以在我的github項目上獲取到——這是一個基于Eclipse的項目,所以它應(yīng)該很容易被導(dǎo)入和運行。

以上就是本文關(guān)于Java高效讀取大文件實例分析的全部內(nèi)容,希望對大家有所幫助。感興趣的朋友可以繼續(xù)參閱本站其他相關(guān)專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!

相關(guān)文章

  • Java中String和StringBuffer及StringBuilder?有什么區(qū)別

    Java中String和StringBuffer及StringBuilder?有什么區(qū)別

    這篇文章主要介紹了Java中String和StringBuffer及StringBuilder?有什么區(qū)別,String?是?Java?語言非?;A(chǔ)和重要的類,更多相關(guān)內(nèi)容需要的小伙伴可以參考下面文章內(nèi)容
    2022-06-06
  • Mybatis使用@param注解四種情況解析

    Mybatis使用@param注解四種情況解析

    這篇文章主要介紹了Mybatis使用@param注解四種情況解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-08-08
  • 淺談Spring AOP中args()和argNames的含義

    淺談Spring AOP中args()和argNames的含義

    這篇文章主要介紹了Spring AOP中args()和argNames的含義,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2021-07-07
  • Spring Cloud下OAUTH2注銷的實現(xiàn)示例

    Spring Cloud下OAUTH2注銷的實現(xiàn)示例

    本篇文章主要介紹了Spring Cloud下OAUTH2注銷的實現(xiàn)示例,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-03-03
  • mybatis攔截器及不生效的解決方法

    mybatis攔截器及不生效的解決方法

    本文主要介紹了mybatis攔截器及不生效的解決方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-04-04
  • Java+Freemarker實現(xiàn)根據(jù)XML模板文件生成Word文檔

    Java+Freemarker實現(xiàn)根據(jù)XML模板文件生成Word文檔

    這篇文章主要為大家詳細(xì)介紹了Java如何使用Freemarker實現(xiàn)根據(jù)XML模板文件生成Word文檔,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以學(xué)習(xí)一下
    2023-11-11
  • Java  匿名內(nèi)部類詳解及實例代碼

    Java 匿名內(nèi)部類詳解及實例代碼

    這篇文章主要介紹了Java 匿名內(nèi)部類詳解及實例代碼的相關(guān)資料,需要的朋友可以參考下
    2017-02-02
  • 詳解SpringCloud mysql實現(xiàn)配置中心

    詳解SpringCloud mysql實現(xiàn)配置中心

    這篇文章主要介紹了詳解SpringCloud mysql實現(xiàn)配置中心,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2018-09-09
  • 關(guān)于JwtToken使用-重點看一下過期時間

    關(guān)于JwtToken使用-重點看一下過期時間

    這篇文章主要介紹了關(guān)于JwtToken使用-重點看一下過期時間,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-07-07
  • Intellij IDEA如何自定義注釋模板的實現(xiàn)方法

    Intellij IDEA如何自定義注釋模板的實現(xiàn)方法

    這篇文章主要介紹了Intellij IDEA如何自定義注釋模板的實現(xiàn)方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2019-05-05

最新評論