關(guān)于Poi讀取Excel引發(fā)內(nèi)存溢出問題的解決方法
前言
最近生產(chǎn)環(huán)境有個老項目一直內(nèi)存報警,不時的還出現(xiàn)內(nèi)存泄漏,導(dǎo)致需要重啟服務(wù)器,已經(jīng)嚴(yán)重影響正常服務(wù)了。
分析
1.dump內(nèi)存文件
liunx使用如下命令:
./jmap -dump:format=b,file=heap.hprof pid
2.使用Eclipse Memory Analysis進(jìn)行分析

異常如下:
at org.apache.poi.xssf.usermodel.XSSFRow.<init>(Lorg/openxmlformats/schemas/spreadsheetml/x2006/main/CTRow;Lorg/apache/poi/xssf/usermodel/XSSFSheet;)V (XSSFRow.java:68) at org.apache.poi.xssf.usermodel.XSSFSheet.initRows(Lorg/openxmlformats/schemas/spreadsheetml/x2006/main/CTWorksheet;)V (XSSFSheet.java:157) at org.apache.poi.xssf.usermodel.XSSFSheet.read(Ljava/io/InputStream;)V (XSSFSheet.java:132) at org.apache.poi.xssf.usermodel.XSSFSheet.onDocumentRead()V (XSSFSheet.java:119) at org.apache.poi.xssf.usermodel.XSSFWorkbook.onDocumentRead()V (XSSFWorkbook.java:222) at org.apache.poi.POIXMLDocument.load(Lorg/apache/poi/POIXMLFactory;)V (POIXMLDocument.java:200) at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(Ljava/io/InputStream;)V (XSSFWorkbook.java:179)
POI在加載Excel引發(fā)了內(nèi)存泄漏,中間創(chuàng)建了大量的對象,占用了大量的內(nèi)存
3.查看上傳的Excel大小
經(jīng)查看發(fā)現(xiàn)很多Excel大小在9M的文件
4.查看代碼POI讀取Excel的方式
發(fā)現(xiàn)使用的是用戶模式,這樣會占用大量的內(nèi)存;POI提供了2中讀取Excel的模式,分別是:
- 用戶模式:也就是poi下的usermodel有關(guān)包,它對用戶友好,有統(tǒng)一的接口在ss包下,但是它是把整個文件讀取到內(nèi)存中的,
對于大量數(shù)據(jù)很容易內(nèi)存溢出,所以只能用來處理相對較小量的數(shù)據(jù); - 事件模式:在poi下的eventusermodel包下,相對來說實(shí)現(xiàn)比較復(fù)雜,但是它處理速度快,占用內(nèi)存少,可以用來處理海量的Excel數(shù)據(jù)。
經(jīng)上面分析基本可以確定問題出在使用POI的用戶模式去讀取Excel大文件,導(dǎo)致內(nèi)存泄漏。
本地重現(xiàn)
下面模擬一個600kb大小的Excel(test.xlsx),分別用兩種模式讀取,然后觀察內(nèi)存波動;
1.需要引入的庫maven:
<dependencies> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.6</version> </dependency> <dependency> <groupId>com.syncthemall</groupId> <artifactId>boilerpipe</artifactId> <version>1.2.1</version> </dependency> </dependencies>
2.用戶模式代碼如下:
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
public class UserModel {
public static void main(String[] args) throws InterruptedException {
try {
Thread.sleep(5000);
System.out.println("start read");
for (int i = 0; i < 100; i++) {
try {
Workbook wb = null;
File file = new File("D:/test.xlsx");
InputStream fis = new FileInputStream(file);
wb = new XSSFWorkbook(fis);
Sheet sheet = wb.getSheetAt(0);
for (Row row : sheet) {
for (Cell cell : row) {
System.out.println("row:" + row.getRowNum() + ",cell:" + cell.toString());
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
Thread.sleep(1000);
} catch (Exception e) {
e.printStackTrace();
}
}
}
3.事件模式代碼如下:
import java.io.InputStream;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.xssf.eventusermodel.XSSFReader;
import org.apache.poi.xssf.model.SharedStringsTable;
import org.apache.poi.xssf.usermodel.XSSFRichTextString;
import org.xml.sax.Attributes;
import org.xml.sax.ContentHandler;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;
import org.xml.sax.helpers.XMLReaderFactory;
public class EventModel {
public void processOneSheet(String filename) throws Exception {
OPCPackage pkg = OPCPackage.open(filename);
XSSFReader r = new XSSFReader(pkg);
SharedStringsTable sst = r.getSharedStringsTable();
XMLReader parser = fetchSheetParser(sst);
InputStream sheet2 = r.getSheet("rId1");
InputSource sheetSource = new InputSource(sheet2);
parser.parse(sheetSource);
sheet2.close();
}
public XMLReader fetchSheetParser(SharedStringsTable sst) throws SAXException {
XMLReader parser = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser");
ContentHandler handler = new SheetHandler(sst);
parser.setContentHandler(handler);
return parser;
}
private static class SheetHandler extends DefaultHandler {
private SharedStringsTable sst;
private String lastContents;
private boolean nextIsString;
private SheetHandler(SharedStringsTable sst) {
this.sst = sst;
}
public void startElement(String uri, String localName, String name, Attributes attributes) throws SAXException {
if (name.equals("c")) {
System.out.print(attributes.getValue("r") + " - ");
String cellType = attributes.getValue("t");
if (cellType != null && cellType.equals("s")) {
nextIsString = true;
} else {
nextIsString = false;
}
}
lastContents = "";
}
public void endElement(String uri, String localName, String name) throws SAXException {
if (nextIsString) {
int idx = Integer.parseInt(lastContents);
lastContents = new XSSFRichTextString(sst.getEntryAt(idx)).toString();
nextIsString = false;
}
if (name.equals("v")) {
System.out.println(lastContents);
}
}
public void characters(char[] ch, int start, int length) throws SAXException {
lastContents += new String(ch, start, length);
}
}
public static void main(String[] args) throws Exception {
Thread.sleep(5000);
System.out.println("start read");
for (int i = 0; i < 100; i++) {
EventModel example = new EventModel();
example.processOneSheet("D:/test.xlsx");
Thread.sleep(1000);
}
}
}
具體代碼來源:http://poi.apache.org/spreadsheet/how-to.html#xssf_sax_api
4.設(shè)置VM arguments:-Xms100m -Xmx100m
UserModel運(yùn)行結(jié)果直接報OutOfMemoryError,如下所示:
Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded at java.lang.String.substring(String.java:1877) at org.apache.poi.ss.util.CellReference.separateRefParts(CellReference.java:353) at org.apache.poi.ss.util.CellReference.<init>(CellReference.java:87) at org.apache.poi.xssf.usermodel.XSSFCell.<init>(XSSFCell.java:105) at org.apache.poi.xssf.usermodel.XSSFRow.<init>(XSSFRow.java:68) at org.apache.poi.xssf.usermodel.XSSFSheet.initRows(XSSFSheet.java:157) at org.apache.poi.xssf.usermodel.XSSFSheet.read(XSSFSheet.java:132) at org.apache.poi.xssf.usermodel.XSSFSheet.onDocumentRead(XSSFSheet.java:119) at org.apache.poi.xssf.usermodel.XSSFWorkbook.onDocumentRead(XSSFWorkbook.java:222) at org.apache.poi.POIXMLDocument.load(POIXMLDocument.java:200) at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(XSSFWorkbook.java:179) at zh.excelTest.UserModel.main(UserModel.java:23)
EventModel可以正常運(yùn)行,使用Java VisualVM監(jiān)控結(jié)果如下:

UserModel模式下讀取600kbExcel文件直接內(nèi)存溢出,看了600kbExcel文件映射到內(nèi)存中還是占用了不少內(nèi)存;EventModel模式下可以流暢的運(yùn)行。
5.設(shè)置VM arguments:-Xms200m -Xmx200m
UserModel可以正常運(yùn)行,使用Java VisualVM監(jiān)控結(jié)果如下:

EventModel可以正常運(yùn)行,使用Java VisualVM監(jiān)控結(jié)果如下:

UserModel模式和EventModel模式都可以正常運(yùn)行,但是很明顯UserModel模式回收內(nèi)存更加頻繁,而且在cpu的占用上更高。
總結(jié)
通過簡單的分析以及本地運(yùn)行兩種模式進(jìn)行比較,可以看到UserModel模式下使用的簡單的代碼實(shí)現(xiàn)了讀取,但是在讀取大文件時CPU和內(nèi)存都不理想;
而EventModel模式雖然代碼寫起來比較繁瑣,但是在讀取大文件時CPU和內(nèi)存更加占優(yōu)。
好了,以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
相關(guān)文章
maven插件maven-jar-plugin構(gòu)建jar文件的詳細(xì)使用
maven-jar-plugin插件時maven中最常用的插件,也是maven構(gòu)建Java程序執(zhí)行包或者依賴包的默認(rèn)插件,本文主要介紹了maven插件maven-jar-plugin構(gòu)建jar文件的詳細(xì)使用,具有一定的參考價值,感興趣的可以了解一下2024-02-02
解決Springboot @WebFilter攔截器未生效問題
這篇文章主要介紹了解決Springboot @WebFilter攔截器未生效問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-10-10
SpringMVC 重定向參數(shù)RedirectAttributes實(shí)例
這篇文章主要介紹了SpringMVC 重定向參數(shù)RedirectAttributes實(shí)例,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-12-12
Java實(shí)現(xiàn)解析JSON大文件JsonReader工具詳解
這篇文章主要介紹了Java實(shí)現(xiàn)解析JSON大文件的工具JsonReader使用方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧2023-01-01
淺析JavaWeb項目架構(gòu)之Redis分布式日志隊列
架構(gòu)、分布式、日志隊列,標(biāo)題自己都看著唬人,其實(shí)就是一個日志收集的功能,只不過中間加了一個Redis做消息隊列罷了。下面通過本文給大家分享JavaWeb項目架構(gòu)之Redis分布式日志隊列,感興趣的朋友一起看看吧2018-01-01

