(5)分布式下的爬虫Scrapy应该如何做-windows下的redis的安装与配置
软件版本:
redis-2.4.6-setup-64-bit.exe — Redis 2.4.6 Windows Setup (64-bit)
系统:
win7 64bit
本篇的内容是为了给分布式下的爬虫做好预热的环境准备,我们知道单机的爬虫始终会有一个性能瓶颈,特别是对于是否爬过的URL来说,存在本地关系型的数据库始终会有一个性能上的考究,这里引入redis,可以很方便的通过集群来解决这个问题,在任何大的问题解决方案上,终究都是采取化整为零,分而治之的思想。如果你对于windows下的配置已经很熟悉了,本次内容可以完全略过。
一,去GitHub上下载关于windows的redis的下载文件:
地址:https://github.com/rgl/redis/downloads
二,解压安装,下一步一步
三,以管理员身份打开CMD,切入到redis的目录,比如我的目录为C:\Program Files\Redis
cd C:\Program Files\Redis
四,以目录形式打开文件夹,将C:\Program Files\Redis\Conf下的redis.conf 配置文件复制到 C:\Program Files\Redis 目录
五,在命令行下输入:redis-server.exe redis.conf

这个时候如果没有进一步报错的话,那就证明已经成功启动服务端了、
六,现在我们以管理员身份启动另一下CMD命令,启动客户端:
redis-cli.exe -h 127.0.0.1 -p 6379

用过bash的应该都了解参数的大致意思了 -h host域名 -p port 端口号
我们来简单的测试一下:
set parm1 mytest
got parm1
输出:
mytest
OK,windows下的安装就已经成功了,关于更高级一点的配置或者将爬虫融入到分布式中,我们下一次在细讲
(5)分布式下的爬虫Scrapy应该如何做-windows下的redis的安装与配置的更多相关文章
- (4)分布式下的爬虫Scrapy应该如何做-规则自动爬取及命令行下传参
		
本次探讨的主题是规则爬取的实现及命令行下的自定义参数的传递,规则下的爬虫在我看来才是真正意义上的爬虫. 我们选从逻辑上来看,这种爬虫是如何工作的: 我们给定一个起点的url link ,进入页面之后提 ...
 - (2)分布式下的爬虫Scrapy应该如何做-关于对Scrapy的反思和核心对象的介绍
		
本篇主要介绍对于一个爬虫框架的思考和,核心部件的介绍,以及常规的思考方法: 一,猜想 我们说的爬虫,一般至少要包含几个基本要素: 1.请求发送对象(sender,对于request的封装,防止被封) ...
 - (3)分布式下的爬虫Scrapy应该如何做-递归爬取方式,数据输出方式以及数据库链接
		
放假这段时间好好的思考了一下关于Scrapy的一些常用操作,主要解决了三个问题: 1.如何连续爬取 2.数据输出方式 3.数据库链接 一,如何连续爬取: 思考:要达到连续爬取,逻辑上无非从以下的方向着 ...
 - (8)分布式下的爬虫Scrapy应该如何做-图片下载(源码放送)
		
转载主注明出处:http://www.cnblogs.com/codefish/p/4968260.html 在爬虫中,我们遇到比较多需求就是文件下载以及图片下载,在其它的语言或者框架中,我们可能 ...
 - (1)分布式下的爬虫Scrapy应该如何做-安装
		
关于Scrapy的安装,网上一搜一大把,一个一个的安装说实话是有点麻烦,那有没有一键安装的?答案显然是有的,下面就是给神器的介绍: 主页:http://conda.pydata.org/docs/ 下 ...
 - (9)分布式下的爬虫Scrapy应该如何做-关于ajax抓取的处理(一)
		
转载请注明出处:http://www.cnblogs.com/codefish/p/4993809.html 最近在群里频繁的被问到ajax和js的处理问题,我们都知道,现在很多的页面都是用动态加载的 ...
 - 用脚本如何实现将Linux下的txt文件批量转化为Windows下的txt文件?
		
众所周知,Windows和Linux的文件换行回车格式不同,Windows下换行格式是\r\n(回车+换行),Linux下换行格式为\n(只是换行),因此,其中一个操作系统的文本文件若需要在另外一个中 ...
 - [Linux]Linux下redis的安装及配置.
		
在上一篇[Linux] linux下安装配置 zookeeper/redis/solr/tomcat/IK分词器 详细实例. 我们已经将redis所需tar包拷贝到了linux下的root 根目录下, ...
 - mac与centos下redis的安装与配置
		
前言 最近在用redis,下面简单写一下mac和centos下redis的安装与配置方法. 安装 mac下面 安装命令:brew intall redis 运行命令:brew services sta ...
 
随机推荐
- ubuntu 16.04 有道词典
			
依赖环境 sudo apt install \ python3-pyqt5 \ python3-requests \ python3-xlib \ python3-pil \ tesseract-oc ...
 - Spring和cxf3的整合,以maven的方式
			
一.引入cxf3 我这里使用的是最新的版本cxf3.1.8 引入cxf3需要在pom.xml加入如下内容: <dependency> <groupId>org.apache.c ...
 - 你可能不知道的python
			
1.如何循环获得下标,使用 enumerate ints = ['a','b','c','d','e','f'] for idx, val in enumerate(ints): print idx, ...
 - 更改ubuntu mysql data目录位置
			
很多时候,mysql的数据会非常大,数据默认放在/var/lib/mysql,由于/var所划分的空间不够大,所以我们需要将mysql数据存放路径修改一下,放到大分区里面,以便可以应付mysql数据增 ...
 - 从Tmux 转到GNU Screen
			
网上很多地方都说Tmux比GNU Screen要好用,不过无意间看到这篇Switching from tmux to GNU Screen之后,我发现GNU Screen的窗口/区域概念更好,至少是更 ...
 - Android中AutoCompleteTextView的使用
			
1.http://blog.csdn.net/FX_SKY/article/details/9326129 此博客讲解了auto组件如何使用baseAdapter来扩展功能,推荐参照此博客写demo ...
 - Microsoft Office Excel 不能访问文件 的解决办法
			
Microsoft Office Excel 不能访问文件"a.xls". 可能的原因有: ? 文件名称或路径不存在. ? 文件正被其他程序使用. ? 您正要保存的工作簿与当前 ...
 - Spark源码系列(五)分布式缓存
			
这一章想讲一下Spark的缓存是如何实现的.这个persist方法是在RDD里面的,所以我们直接打开RDD这个类. def persist(newLevel: StorageLevel): this. ...
 - ExtJS远程数据-本地分页
			
背景 一般情况下,分页展示是前端只负责展示,后台通过SQL语句实现分页查询.当总数据量在千条以下,适合一次性查询出符合条件的所有数据,让前端页面负责分页也是一种选择. 实例 现通过ExtJS 4扩展类 ...
 - 注解Annotation 详解(转)
			
要深入学习注解,我们就必须能定义自己的注解,并使用注解,在定义自己的注解之前,我们就必须要了解Java为我们提供的元注解和相关定义注解的语法. 元注解: 元注解的作用就是负责注解其他注解.Java5. ...