pandas_read_xml 0.0.5XML转DataFrame工具

XML 数据的导入有点麻烦?pandas_read_xml这个小库挺实用,专门帮你把 XML 转成 DataFrame,适合各种嵌套结构的 XML。用起来跟pandas.read_csv差不多,熟悉了之后,上手快。

数据的时候,总绕不开Pandas,但原生的Pandas并不直接支持 XML。这时候pandas_read_xml就派上用场了。它了一个read_xml函数,调用方式基本无缝对接pandas,语法也挺直观。

比如你有个叫data.xml的文件,只要:

import pandas_read_xml as pdx
import pandas as pd

xml_df = pdx.read_xml('data.xml')

结果就是一个标准的DataFrame,你可以继续用.head()查看前几行,或者.to_csv()导出来,配合matplotlibseaborn做也完全没问题。

嗯,有一点要注意:它对结构复杂的 XML 支持得还行,但建议你先用xml.etree看看结构,再确定怎么提。遇到多层嵌套时,参数xpath也蛮有用的。

如果你平常数据清洗用得多,尤其是拿 XML 当数据源,那这个库别错过。安装也简单,直接pip install pandas_read_xml就行。

gz 文件大小:5.26KB