网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁.自动索引.模拟程序或者蠕虫.爬虫实在是计算机从业者的福音,它大大的缩减了我们的工作量.今天,我们就来尝试一下网页的爬取. 首先,我们需要安装两个基本的库,requests和beautifulsoup4. requests:requests是Python中一个第三方库,基于 urllib,采用 Apache2 Licensed…