Python网络爬虫与信息提取 目标:掌握定向网络数据爬取和网页解析的基本能力. the website is the API 课程分为以下部分: 1.requsets库(自动爬取HTML页面.自动网络请求提交) 2.robots.txt规则(网络爬虫排除标准)(合理合法的使用爬虫) 3.beautiful soup库(解析HTML页面)(提取相关项目) 4.projects项目(实战项目A/B) 5.re正则表达式库(正则表达式详解.提取页面关键信息) 6.专业网络爬虫框架scrapy*(网络