Python人人网信息采集与数据挖掘技巧
人人网的安全机制得到了加强,封锁了无权限访问的内容,但仍可通过浏览器抓取可访问的信息。在Ubuntu、Win7和XP环境下均可进行操作。Python版本为2.7,使用igraph和pycairo进行图形绘制,Ubuntu用户可通过apt-get install python3-igraph安装,Win32用户需下载安装igraph和pycairo。使用MySQL作为存储介质时,需要安装相应组件。
renren-master.zip
预估大小:36个文件
renren-master
文件夹
.gitmodules
文件夹
net_graph.py
987B
config
文件夹
spider.ini
132B
grabrr.py
5KB
mysql.ini
1KB
spider.py
5KB
test_net_graph.png
58KB
repo_file.py
2KB
10.08MB
文件大小:
评论区