Python3.6 库:urllib3, bs4 主程序是抓取亚马逊图书销售排名数据,但是亚马逊应该是加了反爬虫,拒绝疑似机器人的请求,这部分暂时以百度代替. 其实简单的页面抓取,常用的urllib.request就能实现,但是urllib3功能更多,应用前景更广,需要学习. 首先导入模块: import urllib3, bs4 定义要访问的页面: urltest = 'https://www.baidu.com' 定义函数,这里对比两种解码方法: def httpget(): http =…