pandas_read_xml 0.0.5XML转DataFrame工具
XML 数据的导入有点麻烦?pandas_read_xml
这个小库挺实用,专门帮你把 XML 转成 DataFrame,适合各种嵌套结构的 XML。用起来跟pandas.read_csv
差不多,熟悉了之后,上手快。
数据的时候,总绕不开Pandas
,但原生的Pandas
并不直接支持 XML。这时候pandas_read_xml
就派上用场了。它了一个read_xml
函数,调用方式基本无缝对接pandas
,语法也挺直观。
比如你有个叫data.xml
的文件,只要:
import pandas_read_xml as pdx
import pandas as pd
xml_df = pdx.read_xml('data.xml')
结果就是一个标准的DataFrame
,你可以继续用.head()
查看前几行,或者.to_csv()
导出来,配合matplotlib
或seaborn
做也完全没问题。
嗯,有一点要注意:它对结构复杂的 XML 支持得还行,但建议你先用xml.etree
看看结构,再确定怎么提。遇到多层嵌套时,参数xpath
也蛮有用的。
如果你平常数据清洗用得多,尤其是拿 XML 当数据源,那这个库别错过。安装也简单,直接pip install pandas_read_xml
就行。
5.26KB
文件大小:
评论区