B 站思政课、文化自信、中国医学史视频评论爬虫

本项目提供从 B 站提取相关视频评论数据的爬虫程序,具体流程如下:

  1. 搜索 B 站获取视频链接和标题
  2. 获取视频 AV 号码
  3. 构造评论链接并使用 JSON 解析
  4. 将评论数据写入 CSV 文件
zip
B站思政课和文化自信、中国医学史视频评论爬虫.zip 预估大小:46个文件
folder
wordcloud 文件夹
file
LICENSE 1KB
folder
codes 文件夹
folder
mooc爬虫 文件夹
file
Mooc课程评价爬虫.py 3KB
folder
医学人文 文件夹
file
课程评价.csv 6KB
file
cloud.jpg 51KB
folder
中国医学史 文件夹
file
课程评价.csv 8KB
file
cloud.jpg 42KB
file
Mooc数据可视化及展示.py 1KB
folder
中华优秀传统文化 文件夹
file
课程评价.csv 90KB
file
cloud.jpg 59KB
folder
思想道德修养与法律基础 文件夹
file
课程评价.csv 187KB
file
cloud.jpg 62KB
file
mask.jpg 37KB
folder
B站爬虫 文件夹
folder
北大张大庆 文件夹
file
评论信息.csv 8KB
file
cloud.jpg 87KB
file
task1_2_爬取评论.py 12KB
folder
思政课 文件夹
file
100个视频详细信息.csv 22KB
file
cloud.jpg 69KB
file
100个视频评论信息.csv 32KB
file
cloud.jpg 45KB
folder
文化自信 文件夹
file
100个视频详细信息.csv 25KB
file
cloud.jpg 73KB
file
100个视频评论信息.csv 284KB
folder
中国医学史 文件夹
file
100个视频详细信息.csv 9KB
file
cloud.jpg 71KB
file
100个视频评论信息.csv 28KB
folder
黑龙江常存库 文件夹
file
评论信息.csv 2KB
file
cloud.jpg 53KB
file
mask.jpg 266KB
file
task3_医学史2个课程评论.py 3KB
file
task5_数据可视化展示.py 2KB
folder
.idea 文件夹
file
workspace.xml 12KB
file
misc.xml 301B
folder
inspectionProfiles 文件夹
file
profiles_settings.xml 174B
file
B站+Mooc.iml 402B
file
modules.xml 270B
file
开发文档.pdf 1.39MB
file
PYTHON爬虫任务.xlsx 9KB
folder
images 文件夹
file
Mooc爬取截图.PNG 59KB
file
B站思政课及文化自信评论数据爬虫.PNG 78KB
file
B站爬虫文件结构.PNG 238KB
file
B站黑龙江和北大爬虫.PNG 51KB
file
B站评论词云生成.PNG 314KB
file
webdriver.PNG 53KB
file
绝对路径.PNG 38KB
file
Mooc可视化.PNG 313KB
file
README.md 2KB
zip 文件大小:3.63MB