新版 Scrapy 中 sys.conf.settings 的替代方法

在 scrapy 项目目录下，有个 settings.py 文件，此文件是用来存放爬虫项目的各种配置，比如说 MongoDB 的服务器、端口号、数据库名等配置信息。

既然是配置信息，就需要在别的文件中引用。比如在 settings.py 文件中增加了如下内容：

MONGODB_HOST = '127.0.0.1'

MONGODB_PORT = 27017

MONGODB_DBNAME = 'maitian'

MONGODB_DOCNAME = 'zufang'

而在 pipelins.py 中想要引用该配置，在以前的版本中，使用方法应为：

from scrapy.conf import settings

host = settings['MONGODB_HOST']

port = settings['MONGODB_PORT']

db_name = settings['MONGODB_DBNAME']

client = pymongo.MongoClient(host=host, port=port)

db = client[db_name]

self.post = db[settings['MONGODB_DOCNAME']]

我电脑上的版本为 1.7.3 ，用上述引用方法报错，大概意思是没有 scrapy.conf 这个模块，在网上查了好久，发现在 1.7 版本之后，scrapy.conf 就被移除了，1.7 以后的版本里，正确使用 settings.py 中配置的方法为：

from scrapy.utils.project import get_project_settings

settings = get_project_settings()

host = settings['MONGODB_HOST']

port = settings['MONGODB_PORT']

db_name = settings['MONGODB_DBNAME']

client = pymongo.MongoClient(host=host, port=port)

db = client[db_name]

self.post = db[settings['MONGODB_DOCNAME']]

即导入 get_project_settings 方法，该方法的返回值即是配置对象。

参考：https://github.com/scrapy/scrapy/pull/3578

新版 Scrapy 中 sys.conf.settings 的替代方法的更多相关文章

php中cal_days_in_month不可用时的替代方法(计算一个月的天数)
在计算某个月中的天数时,由于PHP编译时没有加上--enable-calendar选项,会导致cal_days_in_month方法不可用. 这时,如果不能更改服务器的编译设置,可以通过以下方法实现该 ...
scrapy中的canonicalize_url【转】
转自:http://www.leyle.com/archives/canonicalize_url.html 思考一下:对url进行规范化处理是否是必须的?因为这一步处理涉及到编码转换,对于一个网页的 ...
Scrapy中使用Django的Model访问数据库
Scrapy中使用Django的Model进行数据库访问当已存在Django项目的时候,直接引入Django的Model来使用比较简单 # 使用以下语句添加Django项目的目录到path impo ...
Scrapy中使用cookie免于验证登录和模拟登录
Scrapy中使用cookie免于验证登录和模拟登录引言 python爬虫我认为最困难的问题一个是ip代理,另外一个就是模拟登录了,更操蛋的就是模拟登录了之后还有验证码,真的是不让人省心,不过既然有 ...
爬虫07 /scrapy图片爬取、中间件、selenium在scrapy中的应用、CrawlSpider、分布式、增量式
爬虫07 /scrapy图片爬取.中间件.selenium在scrapy中的应用.CrawlSpider.分布式.增量式目录爬虫07 /scrapy图片爬取.中间件.selenium在scrapy ...
Django 中如何使用 settings.py 中的常量
在用django 框架开发 python web 程序的时候 , 在模板页面经常会用到 settings.py 中设置的常量,比如MEDIA_URL, 我尝试过在模板页面用类似如下的方式程序代码 { ...
scrapy 中日志的使用
我在后台调试在后台调试scrapy spider的时候,总是觉得后台命令窗口打印的东西太多了不便于观察日志,因此需要一个日志文件记录信息,这样以后会方便查找问题. 分两种方法吧. 1.简单粗暴. ...
[转]scrapy中的logging
logging模块是Python提供的自己的程序日志记录模块. 在大型软件使用过程中,出现的错误有时候很难进行重现,因此需要通过分析日志来确认错误位置,这也是写程序时要使用日志的最重要的原因. scr ...
论Scrapy中的数据持久化
引入 Scrapy的数据持久化,主要包括存储到数据库.文件以及内置数据存储. 那我们今天就来讲讲如何把Scrapy中的数据存储到数据库和文件当中. 终端指令存储保证爬虫文件的parse方法中有可迭代 ...

随机推荐

Selenium 文件下载
点击文件下载时,弹出的那个框,webdriver是定位不到的,只有通过第三方工具或方法来操作一.通过PyUserInput模拟键盘按键下载 PyUserInput是模拟鼠标和键盘的一个模块,替代了p ...
[BZOJ5249][九省联考2018]IIIDX：线段树+贪心
分析 GXZlegend orz 构造出一组合法的解并不是难事,但是我们需要输出的是字典序最大的解. 字典序最大有另一种理解方式,就是让越小的数尽量越靠后. 我们从树的根结点出发,从1开始填数,构造出 ...
PX4学习之-uORB msg 自动生成模板解读
最后更新日期 2019-06-22 一.前言在 PX4学习之-uORB简单体验中指出, 使用 uORB 进行通信的第一步是新建 msg.在实际编译过程中,新建的 msg 会转换成对应的 .h..c ...
使用Hive-JDBC遇到的一些问题解决
使用Hive-JDBC遇到的一些问题解决(转) 标签(空格分隔): Hive 1,java.lang.NoClassDefFoundError: org/apache/hive/service/cli ...
sqli-labs(41) and 两php函数的讲解
0X01 构造闭合发现不需要闭合直接构造 id=- union ,database(), 成功注入 0X02 堆叠注入同道理一样的这里我们来了解一下这个函数 mysqli_multi_qu ...
maven国内镜像、国内外仓库（直接下载jar）
阿里: https://maven.aliyun.com/mvn/search 官方: http://repo.maven.apache.org/maven2/ maven仓库阿里巴巴的镜像仓库, ...
laravel 发送html邮件是a标签中的url不显示问题
按模版导出Excel
实现效果: excel模版: ExcelHandle.java package com.common.utils; import java.io.File; import java.io.FileIn ...
Php mysql 常用代码、CURD操作以及简单查询
C/S:Client ServerB/S:Brower Server php主要实现B/S LAMP :Linux系统 A阿帕奇服务器 Mysql数据库 Php语言 mysql常用代码 ...
9. 获得图片路径，构造出训练集和验证集，同时构造出相同人脸和不同人脸的测试集，将结果存储为.csv格式 1.random.shuffle(数据清洗) 2.random.sample(从数据集中随机选取2个数据) 3. random.choice(从数据集中抽取一个数据) 4.pickle.dump(将数据集写成.pkl数据)
1. random.shuffle(dataset) 对数据进行清洗操作参数说明:dataset表示输入的数据 2.random.sample(dataset, 2) 从dataset数据集中选取2 ...

新版 Scrapy 中 sys.conf.settings 的替代方法

新版 Scrapy 中 sys.conf.settings 的替代方法

新版 Scrapy 中 sys.conf.settings 的替代方法的更多相关文章

随机推荐

热门专题