python小型爬虫系统

该系统是一个小型爬虫系统,结构完整,可以爬取百度百科词条及其相关词条的标题和描述,整理输出为html文件
rar
baike_spider.rar 预估大小:12个文件
folder
baike_spider 文件夹
file
url_manager.py 742B
file
html_outputer.py 1KB
file
html_parser.py 2KB
folder
__init__.py 文件夹
file
output.html 7KB
file
spider_main.py 2KB
folder
__pycache__ 文件夹
file
html_downloader.cpython-36.pyc 647B
file
html_parser.cpython-36.pyc 1KB
file
url_manager.cpython-36.pyc 1KB
file
html_outputer.cpython-36.pyc 1KB
file
__init__.cpython-36.pyc 146B
file
html_downloader.py 364B
rar 文件大小:10.26KB