Pandas-Validation 0.1.1数据验证库

pandas 的数据验证工具

pandas-validation-0.1.1.tar.gz这个小库,专门用来在你 DataFrame 时做字段校验。字段类型对不对?有没有空值?值有没有超出范围?它都能帮你兜一层底,省得每次写一堆判断逻辑。

字段规则一上来就能配,格式也比较直白,像{'age': {'type': int, 'min': 0}},是不是挺顺眼?关键是用起来不磨叽,一行代码就能搞定一整张表的验证。

搭配Pandas用起来挺顺手的,尤其你写 ETL、数据清洗时,经常要对一堆表做预,这时候这个库就能派上大用场。要是还用着assert或者try-except做数据判断,那你真的可以试试这个。

啦,它现在版本还小,0.1.1,功能不是多,但轻量、干净。要是你项目体量不大,或者想快速验证下数据结构,这库真的够用了。

如果你对数据验证比较感兴趣,还可以看看这些相关的文章:Pandas 数据库pandas-highcharts,思路拓展一下也不错。

安装的话就老套路:

pip install pandas-validation-0.1.1.tar.gz
搞定。你平时用 Pandas 数据多的话,不妨加上它当个小助手。

gz 文件大小:5.63KB