About This Book, Learn why and how you can efficiently use Python to process data and build machine learning models in Apache Spark 2.0Develop and dep
Python 15 次浏览
PySpark 的基本操作,说白了就是让你用 Python 写 Spark 代码,跑在分布式集群上还挺方便的。数据、过滤、聚合这些,PySpark 都有现成的 API,像filter()、groupBy()都比较好用,语法也跟 Pandas 有点像,上手不会太难。我比较推荐先从RDD玩起,理解一下懒
Python 0 次浏览
这份思维导图文件以结构化的方式,梳理了 Python 中 PySpark 库的基础知识点,适合学习相关技术的读者参考使用。
Python 22 次浏览