Xerces 2.6.2大数据Excel SAX解析
大数据 Excel 文件读写,一直是 Java 开发里挺头疼的活。Apache POI虽然功能全,但遇上十几万行的数据就容易吃不消,内存飙得飞快。这时候,用老牌的xerces-2.6.2.jar来做 SAX 解析,就挺香的。
xerces是 Apache 出的 XML 解析库,比较老但够稳定。它支持SAX和DOM两种模式,不过你要大文件,选 SAX 就对了——边读边,内存占用少,响应也快。
实际用法也不复杂:先把 Excel 通过 POI 转成 XML 流,再丢给 SAX 解析。你需要写个类实现ContentHandler
接口,把startElement
、characters
这些方法实现一下,就能边解析边操作数据了。
记得用xerces-2.6.2.jar
的 SAX 解析器:org.apache.xerces.parsers.SAXParser
。配置好后调用parse()
方法就行,数据就一行一行吐给你了。适合批量入库,或者先再写新 Excel。
要注意的是,Excel 转 XML 时格式会变,比如日期格式、数字精度这些。最好做个字段映射或者格式统一,不面对数据校验就挺麻烦。
如果你经常碰到那种几十 MB 甚至上百 MB 的 Excel 文件,又想省内存不卡顿,那这个组合(POI + Xerces SAX)真的可以一试,挺靠谱的。
872.26KB
文件大小:
评论区