（一）scrapy 安装及新建爬虫项目并运行

> 参考：https://www.cnblogs.com/hy123456/p/9847570.html

在 pycharm 中并没有创建 scrapy 工程的选项，需要手动创建。

这里就有两种创建 scrapy 项目的方式，第一种是先手工创建 scrapy 项目，然后导入到 pycharm 中；第二种是直接在 pycharm 中利用其中的命令行窗口创建项目（我使用的是这种，比较方便）；

1. 手工创建导入方式

创建一个用于当前项目的虚拟空间：
```
virtualenv --no-site-packages ScrapyLearning
```

启动当前虚拟空间：

# 进入当前虚拟空间的相关目录下，windows下在：ScrapyLearning/Scripts/

activate    # 激活当前虚拟空间

安装 scrapy ：

pip install -i https://pypi.douban.com/simple/ scrapy   # 使用豆瓣源

使用 scrapy 创建 scrapy 项目：（千万注意不要直接在 script 目录下新建项目）
```
scrapy startproject ArticleSpider   # ArticleSpider为项目名
```
将 ArticleSpider 项目导入 pycharm。

2. `pycharm` 中创建

pycharm 中新建工程，并选择创建一个用于当前项目的虚拟空间；
在 pycharm 的下端的 Terminal 中输入以下命令以安装 scrapy （如果没有的话）：
```
pip install -i https://pypi.douban.com/simple/ scrapy   # 使用豆瓣源
```
在 pycharm 的下端的 Terminal 中输入：
```
scrapy startproject ArticlePaqu
```
便会在当前项目目录下生成 ArticlePaqu 文件夹，这个便是 scrapy 项目文件夹。

3.创建一个小爬虫

创建一个单个小爬虫，爬取 scrapy 官方指定的一个示例页面：example.com。

命令行或 pycharm 的 Termina 窗口中输入（这里需要进入前面新建的项目目录下）：

scrapy genspider example 'www.example.com'

便会在 spider 文件夹下创建一个爬虫 python 文件，并自动写入初始代码：

# -*- coding: utf-8 -*-

import scrapy



class ExampleSpider(scrapy.Spider):

    name = 'example'

    allowed_domains = ['example.com']

    start_urls = ['http://example.com/']



    def parse(self, response):

        pass

4.运行爬虫

4-1.命令行或 `pycharm` 的 `Terminal` 中输入：

scrapy crawl example

即可启动 example 爬虫。

4-2.直接通过运行 `pycharm` 中 `python` 文件的方式运行：

需要在 scrapy 项目的根目录下创建一个 main.py 文件：

from scrapy.cmdline import execute



import sys

import os   # 用来获取路径的模块



sys.path.append(os.path.dirname(os.path.abspath(__file__)))

execute(['scrapy', 'crawl', 'example'])

即相当于将

scrapy crawl example

命令分成三段组成 list 放入 python 执行程序中的 execute 函数中了。

然后就可以通过右键 run main.py 函数即可运行 example 爬虫。

（一）scrapy 安装及新建爬虫项目并运行的更多相关文章

如何利用scrapy新建爬虫项目
抓取豆瓣top250电影数据,并将数据保存为csv.json和存储到monogo数据库中,目标站点:https://movie.douban.com/top250 一.新建项目打开cmd命令窗口,输 ...
scrapy抓取拉勾网职位信息（一）——scrapy初识及lagou爬虫项目建立
本次以scrapy抓取拉勾网职位信息作为scrapy学习的一个实战演练 python版本:3.7.1 框架:scrapy(pip直接安装可能会报错,如果是vc++环境不满足,建议直接安装一个visua ...
Django安装测试、导入项目以及运行开发服务器
安装Django 下载Django包,解压缩. CMD 进入解压路径下. 执行:python setup.py install 增加环境变量: C:\Python27\Scripts 测试djang ...
eclipse新建web项目，运行后在tomcat安装目录下webapps中没有该项目
一.发现问题在eclipse中新建Dynamic Web Project,配置好本地的tomcat并写好代码后选择Run on Server,但运行后发现在tomcat的安装目录下的webapps并没 ...
安卓开发第一记 android stdio 安装后新建测试项目报错
Failed to resolve:com.android.support:appcompat-v7:报错处理你在使用android studio时是否也出现过上图的报错,你还在为它的出现烦恼? ...
python爬虫框架—Scrapy安装及创建项目
linux版本安装 pip3 install scrapy 安装完成 windows版本安装 pip install wheel 下载twisted,网址:http://www.lfd.uci.edu ...
在windows下如何新建爬虫虚拟环境和进行scrapy安装
Scrapy是Python开发的一个快速.高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据.Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改.Sc ...
在Pycharm中运行Scrapy爬虫项目的基本操作
目标在Win7上建立一个Scrapy爬虫项目,以及对其进行基本操作.运行环境:电脑上已经安装了python(环境变量path已经设置好), 以及scrapy模块,IDE为Pycharm .操作如下: ...
python3 scrapy爬虫项目的诞生
前提安装好scrapy模块最好 requests和bs4模块都安装好可以概括为五个步骤步骤一:新建一个项目无论你用windows也好,linux也罢,在cmd或者终端切换到目标文件夹,然后输入 ...

随机推荐

ubuntu安装更换阿里云镜像源
如果使用apt-get安装软件过慢,可以考虑以下步骤 1.备份 sudo cp /etc/apt/sources.list /etc/apt/sources.list.bak 2.编辑 sudo vi ...
《剑指offer》面试题06. 从尾到头打印链表
问题描述输入一个链表的头节点,从尾到头反过来返回每个节点的值(用数组返回). 示例 1: 输入:head = [1,3,2] 输出:[2,3,1] 限制: 0 <= 链表长度 <= 10 ...
【记录一个问题】android下的ucontext协程，因为使用栈上的对象，导致cv::Mat被莫名析构
工作的流程是这样:某个协程在栈上创建task对象,在task对象内有需要返回的cv::Mat. 然后把task放到另一个线程上去执行,然后切换到别的协程,等到工作线程执行完task后,再唤醒协程. 这 ...
Redis的几点积累
1.Redis比memcache快 Redis具有事务,持久化等机制,但是它还能做到高性能,原因包括如下: Libevent.和Memcached不同,Redis并没有选择libevent.Libev ...
使用Xamarin开发移动应用示例——数独游戏（一）项目的创建与调试
最近项目中需要移动客户端,由于团队基本上使用.Net产品线,所以决定使用Xmarin进行开发,这样技术路线统一,便于后期维护.官网上是这样介绍的" Xamarin 允许你使用 .NET 代码 ...
python 使用sqlite,ConfigParser实例
此实例是本人公司真实场景,使用了VNC,ngrok 技术实现内网穿透,本例是对内网穿透的使用: 此例的最终效果是对于处于各地内网终端实现远程桌面监控及操作: 目前世面上也有一些软件实现了内网穿透(向日 ...
python代码加注释--6
备注:#用来注释代码,#后面的内容会被python解释器忽略
学习Java第2天
今天所做的工作: 1.学习Java语言变量的使用 2.学习Java语言的算数运算符及逻辑运算符 3.学习选择结构 4.编程检验学习成果明天工作安排: 1.循环结构 2.字符串 3.数组 4.面向对象 ...
maven中profiles使用详解
使用的场景常常遇到一些项目中多环境切换的问题.比如在开发过程中用到开发环境,在测试中使用测试环境,在生产中用生产环境的情况.springboot中提供了 spring.profile.active的 ...
ApacheCN Angular 译文集 20211114 更新
Angular 专家级编程零.前言一.架构概述和在 Angular 中构建简单应用二.将 AngularJS 应用迁移到 Angular 应用三.使用 Angular CLI 生成具有最佳实践 ...

（一）scrapy 安装及新建爬虫项目并运行

1. 手工创建导入方式

2. pycharm 中创建