Web Scraper Chrome Extension网页数据提取插件

网页数据的批量提取工具我试过不少,web-scraper-chrome-extension算是比较省心的。它是基于 Chrome 扩展开发的,用法还挺人性化:你只要建个站点地图,设定好从哪开始爬、怎么走、要抓哪些内容,它就能自动帮你把网页数据一页页扒下来。

支持多起始 URL复杂表格的解析,还有对动态加载内容的也做得不错——像分页、懒加载的网页,用它都能搞定。数据导出呢,也比较灵活,可以直接拿到CSV或者JSON Lines格式,拿去做或者二次都方便。

插件更新也蛮勤快,像 v0.3.6 这版就补了不少细节:支持复杂表格结构、加了 REST API,还能通过文件导入导出站点地图。这对经常重复配置的人来说,省了不少时间。对了,它现在也支持多语言了,连俄语都加上了,挺国际化的。

不过要注意哈,它不是万能神器,像有些通过 JS 渲染内容的复杂网站,需要你多花点心思写规则,甚至结合动态脚本注入。但一般的商品列表、目录页、博客文章这些,问题都不大。

如果你平时有抓数据的需求,又不想上来就整 Selenium、Puppeteer 这些重工具,那这个插件挺值得一试的。你可以看看这篇文章,有网友写得还挺详细的。

zip 文件大小:1.43MB