豆瓣爬虫 - 一百例

豆瓣电影爬虫

该爬虫从豆瓣电影Top250页面获取电影信息，包括名称、评分、类型等，进行数据保存，可视化呈现和词频统计分析。

Python 26 次浏览 2024-05-02

豆瓣图书爬虫解析流程

爬虫程序，自动化抓取网络信息的利器。其核心流程包括：首先，爬虫从初始URL出发，不断发现并收集新的网页链接；其次，通过HTTP请求获取网页内容；然后，利用正则表达式、XPath等工具解析网页，提取所需信息；最后，将提取的数据存储至数据库或文件中。爬虫在应用中需遵守robots.txt协议，并应对反爬

Python 27 次浏览 2024-05-11

豆瓣Top250爬虫指南

使用Python爬取豆瓣Top250电影数据并保存为Excel表格，还提供剧照下载功能。

Python 25 次浏览 2024-04-29

爬虫_豆瓣电影_v2

v2版本，在第一个版本上增加爬取海报保存到本地文件，增加爬取电影类型，导演名并保存.csv文件。python爬虫基础框架，爬的网站是豆瓣电影，根据豆瓣电影一条网址，爬取电影名和电影简介，并根据同页面热映电影的超链接爬取下一个电影和电影简介，循环

Python 25 次浏览 2024-08-27

python爬虫：采集豆瓣音乐信息

用Python编写爬虫程序，获取豆瓣音乐相关数据。

Python 20 次浏览 2024-04-22

python关于豆瓣评论的爬虫

基于scrap框架关于豆瓣的爬虫的python代码，仅供大家学习参考

Python 17 次浏览 2024-07-28

豆瓣爬虫PHP采用ThinkPHP 5.2框架

想用 PHP 写个爬虫抓豆瓣数据？这套“豆瓣爬虫项目 php 采用 thinkphp5.2 框架.zip”挺适合的，直接上手就能感受到 ThinkPHP5.2 框架的便利。爬取豆瓣电影、图书、音乐等数据，从配置到存储都涵盖了。通过 PHP 的cURL库发送求，利用 DOM 解析抓取的 HTML，轻松

PHP 0 次浏览 2025-06-09

豆瓣评论爬虫程序，基于Python，快捷好用

豆瓣影视评论爬取程序，拥有简洁的界面，使用方便，非常适合想要获取豆瓣评论做可视化和词云图的小伙伴，使用时请按照程序中的提示操作，（tips:使用无任何难度，不用有心理压力ヾ(≧▽≦*)o），爬取到的评论会自动保存为‘页数.txt’这样格式的文件，方便整理。最好选好自己的保存位置（不过评论文本什么的占

Python 26 次浏览 2024-07-23

python爬虫源码-豆瓣读书Top250

Python 17 次浏览 2024-10-04

爬虫获取豆瓣正在热映电影信息项目

通过爬虫获取豆瓣正在热映的电影，以及相关信息，如电影名、导演、发行时间、主演等等。注意代码编写时间为2021年10月，如果页面变动，xpath需要调整。

Python 19 次浏览 2024-08-12