爬虫环境搭建及 scrapy 启动

创建虚拟环境

C:\Users\Toling>mkvirtualenv article

这个是普通的创建虚拟环境，但是实际开发中可能会使用python2或python3所以我们需要指定开发的环境

Microsoft Windows [版本 10.0.17134.885]

(c)  Microsoft Corporation。保留所有权利。

C:\Users\Toling>mkvirtualenv --python3=C:\Users\Toling\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Python 3.7\python.exe article

格式：mkvirtualenv --python=py路径\python.exe  环境名称

安装scrapy架构

常规安装： pip install scrapy

更换豆瓣源：pip install -i https://pypi.douban.com/simple/ scrapy

注意掉坑，如果出现报错：

以下是我个人在安装scrapy时遇见的问题及我的解决方法

(1)运行命令

pip install Scrapy

在执行到“Collecting Twisted>=13.1.0 (from Scrapy)”时报错：Exception:Traceback (most recent call last).....

原因：我当前的版本是pip 9.0.1，需要升级到9.0.3

运行命令：

python -m pip install --upgrade pip

(2)升级后再次执行

pip install Scrapy

报错：Command "python setup.py egg_info" failed with error code 1 in C:\Users\LUOXIA~1\AppData\Local\Temp\pip-build-5hi6welx\Twisted\Complete output from command python setup.py egg_info:

原因：setup.py的版本问题

运行命令：

pip install setuptools==33.1.1

(3)再次执行

pip install Scrapy

报错“Command ""c:\program files\python36\python.exe" -u -c "import setuptools, tokenize;__file__='C:\\Users\\LUOXIA~1\\AppData\\Local\\Temp\\pip-build-rdyp2fl9\\Twisted\\setup.py';f=getattr(tokenize, 'open', open)(__file__);code=f.read().replace('\r\n', '\n');f.close();exec(compile(code, __file__, 'exec'))" install --record C:\Users\LUOXIA~1\AppData\Local\Temp\pip-pge7_20d-record\install-record.txt --single-version-externally-managed --compile" failed with error code 1 in C:\Users\LUOXIA~1\AppData\Local\Temp\pip-build-rdyp2fl9\Twisted\”

解决方法：下载安装twisted对应版本的whl文件，比如：我的是Twisted-17.9.0-cp36-cp36m-win_amd64.whl，cp后面是python版本，amd64代表64位

下载网址：https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted

运行命令：

pip install F:\python\mytool\Twisted-17.9.0-cp36-cp36m-win_amd64.whl

其中install 后面为下载的whl文件的完整路径名

技巧：可以打开文件所在目录然后点击导航栏，复制地址。然后重命名文件就可以复制文件名（记得打开拓展名）。

(4)安装完成后，再次运行：

pip install Scrapy

报错：Collecting pyasn1 (from service-identity->Scrapy)

Could not find a version that satisfies the requirement pyasn1 (from service-identity->Scrapy) (from versions: )
No matching distribution found for pyasn1 (from service-identity->Scrapy)

原因：缺少pyasn1

运行命令：

pip install pyasn1

pycharm中导入scrapy

操作过程：

爬虫环境搭建及 scrapy 启动的更多相关文章

selenium+python爬虫环境搭建
前言: 准备使用selenium爬取网站数据,先搭建selenium+python爬虫环境搭建系统环境: 64位win10系统,同时装python2.7和python3.6两个版本,IDE为pych ...
Android 环境搭建资料及启动过程中问题汇总
一.环境搭建资料推荐谷歌自己开发的Android Studio 工具可以从这个网址下载:http://tools.android-studio.org/,直接下载推荐的就行二.安装安装时最好指定 ...
UVE开发环境搭建及项目启动
1.IDE安装visual studio code ,略: 2.node安装(node-v10.5.0-win-x64.zip),解压即可: 3.配置node环境变量,cmd 输入node -v.np ...
学习elasticsearch(一)linux环境搭建(2）——启动elasticsearch
在启动访问es的过程中遇到了各种的奇葩问题. 1.网上各种版本的启动方式让人眼花缭乱不知如何启动.简单粗暴——到es的bin目录下直接执行 ./elasticsearch //显示启动,ctrl+c ...
RPI学习--环境搭建_默认启动桌面/终端修改
参见:http://elinux.org/RPi_raspi-config 首次运行Raspbian会自动进入设置,往后也可以重新进入设置: $ sudo raspi-config 选项3 Enabl ...
python3爬虫环境搭建
安装python3 sudo apt-get install python3-dev build-essential libssl-dev libffi-dev libxml2 libxml2-dev ...
Ningx集群环境搭建
Ningx集群环境搭建 Nginx是什么? Nginx ("engine x") 是⼀个⾼性能的 HTTP 和反向代理服务器,也是⼀个 IMAP/ POP3/SMTP 代理服务 ...
Centos7搭建Scrapy爬虫环境
写在前面因为之前的爬虫环境一直是部署在我自己本地的电脑上的,最近,写了一个监控别人空间的爬虫,需要一直线上24小时运行,所有就打算云服务器上部署环境,也捣鼓了好一会才弄好,还是有一些坑,这里先记录一 ...
linux下scrapy环境搭建
最近使用scrapy做数据挖掘,使用scrapy定时抓取数据并存入MongoDB,本文记录环境搭建过程以作备忘 OS:ubuntu 14.04 python:2.7.6 scrapy:1.0.5 D ...

随机推荐

编译php扩展
在php编译安装好的情况下php扩展编译 php的很多模块都是以php的扩展形式来进行的.所以在php安装好的环境下需要用到之前安装时没有编译安装的php扩展的时候,这个时候编译安装php扩展就显得尤 ...
10月17日 JS开始日~
1.变量提升变量提升是浏览器的一个功能,在运行js代码之前,浏览器会给js一个全局作用域,叫window, window分为两个模块,一个叫做内存模块,一个叫做运行模块,内存模块找到当前作用域下的 ...
【朝花夕拾】Android自定义View篇之（五）Android事件分发机制（上）Touch三个重要方法的处理逻辑
前言转载请注明,转自[https://www.cnblogs.com/andy-songwei/p/10998855.html]谢谢! 在自定义View中,经常需要处理Android事件分发的问题, ...
（数据科学学习手札63）利用pandas读写HDF5文件
一.简介 HDF5(Hierarchical Data Formal)是用于存储大规模数值数据的较为理想的存储格式,文件后缀名为h5,存储读取速度非常快,且可在文件内部按照明确的层次存储数据,同一个H ...
并发编程-concurrent指南-原子操作类-AtomicInteger
在java并发编程中,会出现++,--等操作,但是这些不是原子性操作,这在线程安全上面就会出现相应的问题.因此java提供了相应类的原子性操作类. 1.AtomicInteger
常用的方法论-5W2H
02(b)多元无约束优化问题-最速下降法
此部分内容接02(a)多元无约束优化问题的内容! 第一类:最速下降法(Steepest descent method) \[f({{\mathbf{x}}_{k}}+\mathbf{\delta }) ...
jdk源码--LinkedList
本文基于jdk1.8_171 LinkedList介绍之前看了ArrayList,内部是一个数组.这次看了LinkedList,作用和ArrayList一样,但是内部是链表形式.链表结构如下图: 数 ...
.NetCore应用多个target framework
<Project Sdk="Microsoft.NET.Sdk.Web"> <PropertyGroup> <TargetFrameworks> ...
Appium+python自动化（二十）- 猴哥失散多年的混血弟弟还是妹妹- Monkey（猴子）日志（超详解）
简介日志是非常重要的,用于记录系统.软件操作事件的记录文件或文件集合,可分为事件日志和消息日志.具有处理历史数据.诊断问题的追踪以及理解系统.软件的活动等重要作用,在开发或者测试软系统过程中出现了问 ...

爬虫环境搭建及 scrapy 启动

爬虫环境搭建及 scrapy 启动的更多相关文章

随机推荐

热门专题