Kotlin DataFrame本地数据处理库

Kotlin 的DataFrame库,挺适合做本地数据的,尤其你平时要跟CSVJSON文件打交道的话,试试它真的不亏。它支持分层结构、列空值追踪,复杂数据结构的时候顺手又省心。

静态类型的 API 是个亮点,写起来有类型提示,列名也能自动补全,不容易出错。跟Jupyter Notebook还能无缝配合,做点数据展示也挺舒服的。

基本用法也不复杂,核心就是三个概念:DataColumnDataFrameDataRow。想象成表格的列、表和行。多个DataColumn就组成了一个DataFrame,你可以像操作 Excel 那样按列筛选、变换、合并。

依赖配置你可以照着这样来:

repositories {
  maven { url 'https://kotlin.bintray.com/kotlin-datascience' }
}

dependencies { compile 'org.jetbrains.kotlin:dataframe:0.0.8-dev-89' }

如果你用惯了 Python 的Pandas,这个库的思路你肯定不陌生。想切换语言但保留数据思路?它是个不错的平替。

对了,数据格式杂一点也别怕,它读CSVJSON都没啥压力,层级数据起来也比较顺。

如果你有兴趣,还可以看看Pandas 数据包cJSON 库这些资源,拓展下对比视野。

,如果你在用 Kotlin,又经常结构化数据,那这库真挺香的。

zip 文件大小:1.96MB