Python for Data Analysis 2nd Edition数据分析入门书

数据初学者的入门利器,Python for Data Analysis 第二版是 Wes McKinney 写的,嗯,就是那个 pandas 之父。内容不光系统,还挺实用。全书围绕 pandasNumPyJupyter,还有一些可视化的东西,写得清楚又接地气。

544 页的内容不是白给的,书里不少案例都能直接用,尤其适合你平时要 Excel 表、CSV、数据库导出那类数据的时候。比如用 groupby 做聚合,或者用 pivot_table 重塑数据结构,响应也快,代码也简单。

Jupyter Notebook那块也讲得比较细,边写边跑,还能直接画图,蛮适合做数据探索那一步。还有像 matplotlibIPython 的配合使用,也有一套。用得顺手,效率高。

书是基于 Python 3.6 写的,虽然现在版本更新了,但核心 API 没太大变化。看完基本就能把日常的数据搞定。要是你刚学完 Python 基础,或者 Python 还行但不太会数据,那这本真是不错的过渡材料。

对了,书里的数据文件和代码都在 GitHub 上,方便跟着练手。推荐你也看看下面这些相关资源,扩展一下知识面:

如果你经常需要结构化数据、写数据清洗脚本、做些可视化,这本书你真的可以好好翻一翻,提升会挺的。

pdf 文件大小:10.07MB