Python XML解析方法对比

Python 的 XML 解析工具里,SAXDOM这俩算是老熟人了,场景不同,用法也不太一样。

SAX 的事件驱动模式,挺适合你搞大文件那种情况,边解析边,内存占得少,效率也高。像日志、实时流这类场景,用它就对了。只不过写起来稍微麻烦点,需要你各种事件回调。

DOM就更适合文件不大的时候用,整个 XML 一下加载进内存,操作起来直观多了。想改哪儿点哪儿,像拿着放大镜修文档一样清晰。不过文档一大,内存吃得也不少。

我平时要是拿到个配置文件,几百行那种,一般直接上minidom;但要是爬虫回来几兆的 XML,或者服务端日志流,那就果断换成xml.sax。两个方式都自带在 Python 标准库里,免装包,直接用,算是比较省心。

你也可以根据自己的场景来定,反正熟悉了这两个思路,后续遇到别的 XML 方式也都能举一反三。

pdf 文件大小:86.86KB