2.1 Python3.5安装以及爬虫需要的环境配置

之所以选用Python，是因为对于网络爬虫来说，Python是最好上手的一种语言。本文讲述的安装配置都是基于Windows的环境。

另外我想说的是，文中用到的下载链接尽量官方网站上的下载链接，这是我比较喜欢的下载方式，一方面下载可靠，一方面链接稳定。如果官网要翻墙才能进去的话，为了方便读者操作，就使用百度的下载链接了。

一、Python3安装

首先，下载Python3，这里使用Python3.5.1版本，点击下载：64位版本，32位版本。

双击打开，进行安装。特别注意：要勾选上"Add to Path"选项，否则后面会很麻烦。

打开cmd窗口，测试一下是否真的装好了。

如果刚才安装的时候没有勾选"Add to Path"，这个时候可能会报错，这里就不讲解添加环境变量的方法了，建议直接卸载重装。

二、Python3的IDE

现在，Python3的运行环境已经装好了，我们还需要一个IDE。这里建议有两种选择，第一种是Notepad++，第二种是PyCharm。

1. Notepad++

　　Notepad++下载地址

　　安装完成后，下面说明怎么在Notepad++中安装运行python的插件。

　　点击"Show Plugin Manager"。

　　找到PyNPP，点击Install。

　　安装成功以后，就可以运行Python代码了。

2. PyCharm

　　PyCharm下载地址

　　这是一个专门给Python编程用的IDE，用起来比Notepad++多的功能基本上就是工程管理和自动补全。一般来说下载Community版本就够用了。安装完成以后就可以使用了。

三、Python3爬虫包安装

这里使用requests和beautifulsoup作为主要的爬虫工具。安装方式很简单。打开cmd，输入这两行代码：

pip install beautifulsoup4

pip install requests

Python3默认会自动安装pip，直接使用即可。

可以用下面一段简单的代码来测试一下这两个包：

# coding : utf-8

import requests

from bs4 import BeautifulSoup

r = requests.get("http://news.163.com/")

soup = BeautifulSoup(r.content,'html.parser',from_encoding="gb18030")

for i in soup.find_all('a'):

    try:

        print(i["href"])

    except Exception as e:

        pass

几行代码就实现了把网易新闻首页的所有链接都提取出来了。是不是很方便？

要了解更多关于这两个包的知识可以去看官方文档，写的非常清楚。

requests文档

beautifulsoup文档

　　至此，我们已经配置好了需要的所有爬虫工具，后面会详细介绍怎么在项目中使用。

　　拓展阅读：其实Python可以使用的爬虫包还有很多，这里使用的是requests，其实对于一些有网页动态代码抓取需求的还可以使用selenium。可以参考我的另一篇博客python3初识selenium。

2.1 Python3.5安装以及爬虫需要的环境配置的更多相关文章

Blackey win10 + python3.6 + VSCode + tensorflow-gpu + keras + cuda8 + cuDN6N环境配置（转载）
win10 + python3.6 + VSCode + tensorflow-gpu + keras + cuda8 + cuDN6N环境配置写在前面的话: 再弄这个之前,我对python也好 ...
win8 64位系统，安装JDK的步骤及其环境配置
工具/原料 jdk-8u51-windows-x64.exe 下载地址:::http://www.cr173.com/soft/55503.html#address jdk 安装步骤 1:到oracl ...
安装Nginx+Lua+OpenResty开发环境配置全过程实例
安装Nginx+Lua+OpenResty开发环境配置全过程实例 OpenResty由Nginx核心加很多第三方模块组成,默认集成了Lua开发环境,使得Nginx可以作为一个Web Server使用. ...
scrapy爬虫笔记(一)------环境配置
前言: 本系列文章是对爬虫的简单介绍,以及教你如何用简单的方法爬取网站上的内容. 需要阅读者对html语言及python语言有基本的了解. (本系列文章也是我在学习爬虫过程中的学习笔记,随着学习的深入 ...
win10 + python3.6 + VSCode + tensorflow-gpu + keras + cuda8 + cuDN6N环境配置
写在前面的话: 再弄这个之前,我对python也好,tensorflow也好几乎是0认知的,所以配置这个环境的时候,走了不少弯路,整整耗费了一个星期的时间才搭配完整这个环境,简直了...然而最气的是, ...
Python3编译安装以及创建虚拟运行环境
一.yum安装pip# yum -y install epel-release #Centos6.8安装epel源# yum -y install python-pip手动安装pip# wget ...
anaconda python3.7 安装 tensorflow-gpu 2.0.0 beta1 配置PyCharm
参考tensorflow 公众号<tensorflow2.0 安装指南> https://mp.weixin.qq.com/s/7rNXFEC5HYe91RJ0-9CKdQ # 1. NV ...
Hive安装（一）之环境配置
Hive Web Interface(HWI)简介:Hive自带了一个Web-GUI,功能不多,可用于效果展示,如果没有安装Hue的话,是个不错的选择. 由于hive-bin包中没有包含HWI的页面, ...
用composer安装 Laravel | Laravel需要的环境配置
一:安装参考网站 http://v4.golaravel.com/docs/4.2/installation 1.先确保安装好了PHP,和服务器环境 2.然后下载composer可执行文件到当前目录 ...

随机推荐

php 删除指定扩展名文件
<?php /** *@param $path文件夹绝对路径 $file_type待删除文件的后缀名 *return void */ function clearn_file($path, $f ...
PHP 使用GD库合成带二维码和圆形头像的海报步骤以及源码实现
PHP 使用GD库合成带二维码和圆形头像的海报步骤以及源码实现之前记录过一篇文章,不过那只是简单将二维码合成到海报中去,这次还要合成头像,而且是圆形.所需要素材就不一一列举,直接代码吧 1.先获取用 ...
php-5.6.26源代码 - opcode处理器，“乘法opcode”处理器
// opcode处理器 - 运算符怎么执行: “*” 乘法opcode处理器 static int ZEND_FASTCALL ZEND_MUL_SPEC_CONST_CONST_HANDLER(Z ...
JZOJ 5922. sequence
5922. [NOIP2018模拟10.23]sequence (File IO): input:sequence.in output:sequence.out Time Limits: 1000 m ...
C6748的GPIO口配置使用
2018年1月17日更新: 这几天用了创龙的C6748的库,对于GPIO配置十分不爽,我移植了RK6748的库,用起来十分酸爽,把下面的文件加入到工程中,然后include头文件后就可以使用.非常好使 ...
Python分布式爬虫抓取知乎用户信息并进行数据分析
在以前的文章中,我写过一篇使用selenium来模拟登录知乎的文章,然后在很长一段时间里都没有然后了... 不过在最近,我突然觉得,既然已经模拟登录到了知乎了,为什么不继续玩玩呢?所以就创了一个项目, ...
Open source cryptocurrency exchange
Peatio: https://github.com/peatio/peatio ViaBTC: https://github.com/viabtc/viabtc_exchange_server
POJ3246
Description For the daily milking, Farmer John's N cows (1 ≤ N ≤ 50,000) always line up in the same ...
PHP.34-TP框架商城应用实例-后台10-商品分类-需求分析、创建无限级商品分类，递归
商品管理需求分析 1.实现商品无限级分类管理[类似京东三级分类] 2.添加商品时要指定商品属于一个主分类和多个扩展分类[扩展分类可以是其他主分类] 3.商品列表中可以根据分类搜索商品 a) 搜索一个分 ...
Block那些事儿
1.Block底层原理实现首先我们来看四个函数 void test1() { int a = 10; void (^block)() = ^{ NSLog(@"a is %d", ...

2.1 Python3.5安装以及爬虫需要的环境配置

2.1 Python3.5安装以及爬虫需要的环境配置的更多相关文章

随机推荐

热门专题