某东评论获取数据采集、清洗、可视化与分析项目

某东评论的抓取项目,整个流程走得挺顺的。从评论内容抓取到情感、再到可视化展示,流程比较完整,适合当数据库课程设计练练手。像会员等级、购买时间这些数据拿来做画像也蛮有意思的,对后续个性化推荐挺有参考价值。抓取的内容也挺全,评论、星级、型号都在,数据清洗这块也用得上pandas。如果你对电商数据感兴趣,又想练练爬虫可视化数据,这个资源还挺值得一试的。

zip
京东评论爬虫,包含对数据的采集、清洗、可视化、分析等过程,作为数据库课程设计项目.zip 预估大小:22个文件
folder
jdcomment_spider 文件夹
file
数据库报告.pdf 1.89MB
file
SpiderScript.py 5KB
folder
picture 文件夹
file
月消费与会员等级分析.png 93KB
file
手机购买时段.png 47KB
file
image-20210819134514961.png 353KB
file
phoneComment.jpg 97KB
file
Snipaste_2019-03-06_22-22-48.PNG 57KB
file
phone.jpg 31KB
file
.gitattributes 64B
folder
data 文件夹
file
京东url采集.txt 4KB
file
taobaoComment_data.csv 281KB
file
JDComment_data.csv 5.7MB
file
LICENSE 1KB
folder
front 文件夹
file
simsunb.ttf 16.27MB
file
simsun.ttc 17.37MB
file
Taobao_Spider.ipynb 11KB
file
JDComment_Processing.ipynb 16KB
file
requirements.txt 111B
file
数据库报告.docx 2.24MB
folder
.ipynb_checkpoints 文件夹
file
JDComment_Processing-checkpoint.ipynb 16KB
file
Taobao_Spider-checkpoint.ipynb 11KB
file
README.md 15KB
zip 文件大小:23.88MB