定时启动爬虫 # 查看命令得绝对路径 # which scrapy # cd到爬虫得项目目录下 + scrapy命令得绝对路径 + 启动命令 */5 * * * * cd /opt/mafengwo/mafengwo/spiders && /usr/bin/scrapy crawl mfw_spider >>/var/log/cron_error.log 2>&1 # 将正确和错误日志都打印到日志中 每5分钟执行一次mfw_spider这个爬虫程序 tail -f…
1 crontab -e 配置启动定时任务 */1 * * * * sh /home/admin/application/wd/core-python/getMemPositionFromAnaualOrChangeInfo/start.sh #start.sh 为启动文件 start.sh文件里面的内容: #! /bin/bash #~ /home/admin/.bashrc cd /home/admin/application/wd/core-python/getMemPositionFro…
1.  Crontab介绍 crontab的语法规则格式: 代表意义 分钟 小时 日期 月份 周 命令 数字范围 0~59 0~23 1~31 1~12 0~7 需要执行的命令 周的数字为 0 或 7 时,都代表“星期天”的意思. 另外,还有一些辅助的字符,大概有下面这些: 特殊字符 代表意义 *(星号) 代表任何时刻都接受的意思.举例来说,0 12 * * * command 日.月.周都是*,就代表着不论何月.何日的礼拜几的12:00都执行后续命令的意思. ,(逗号) 代表分隔时段的意思.举…
https://my.oschina.net/u/2487410/blog/683308 使用linux curl命令讲解:http://www.linuxdiyf.com/linux/2800.html [root@jiangbo ~]# crontab -ecrontab: installing new crontabYou have new mail in /var/spool/mail/root[root@jiangbo ~]# crontab -l*/1 * * * * /usr/bi…
1.    进程.线程的概念 a.    进程是操作系统进行资源分配的单位. b.    线程(Thread)是程序中独立的指令流,是CPU调度和分派的基本单位. c.     多进程是指同时运行多种程序.或者一个程序多个进程. d.    多线程是为了使得多个线程并行的工作以完成多项任务,以提高系统的效率; 进程和线程的主要差别:进程和线程的主要差别在于它们是不同的操作系统资源管理方式.进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其它进程产生影响,而线程只是一个进程中的不同执行路径…
前言: cpu的位是指一次性可处理的数据量是多少,1字节=8位,32位处理器可以一次性处理4个字节的数据量,依次类推.32位操作系统针对的32位的CPU设计.64位操作系统针对的64位的CPU设计.操作系统只是硬件和应用软件中间的一个平台.我们的CPU从原来的8位,16位,到现在的32位和64位. 背景: 电脑的内存是8GB, 装的是32位的Win 7 32位版本,系统认出的内存是3.5GB, 应该说是4GB,因为还有0.5GB内存分配给了显存. 笔者十分痛苦,花重金购置的骇客神条单条8GB竟然…
首先得有一个Scrapy项目,我在Desktop上新建一个Scrapy的项目叫test,在Desktop目录打开命令行,键入命令:scrapy startproject test1  目录结构如下:    打开Pycharm,选择open 选择项目,ok 打开如下界面之后,按alt + 1, 打开project 面板 在test1/spiders/,文件夹下,新建一个爬虫spider.py, 注意代码中的name="dmoz".这个名字后面会用到. 在test1目录和scrapy.cf…
用 Scrapy 做好的爬虫使用 Scrapyd 来管理发布启动等工作,每次手动执行也很繁琐;考虑可以使用 Hangfire 集成在 web 工程里. Scrapyd 中启动爬虫的请求如下: curl http://172.0.0.1:8081/schedule.json -d project=spider -d spider=jrj_spider -u name:pwd {, "} 修改: /// <summary> /// 执行方法 /// </summary> pu…
scrapy作为流行的python爬虫框架,简单易用,这里简单介绍如何使用该爬虫框架爬取个人博客信息.关于python的安装和scrapy的安装配置请读者自行查阅相关资料,或者也可以关注我后续的内容.   本文使用的python版本为2.7.9  scrapy版本为0.14.3    1.假设我们爬虫的名字为vpoetblog   在命令行下切换到桌面目录,输入startproject scrapy vpoetblog 如下图所示:    命令执行成功后会在桌面生成一个名为vpoetblog的文…
修改了mysql的my.cnf可还是不行,启动后就是3307,必须关掉再启动. 觉得可能是mac系统在哪里写死了开机启动项. http://queforum.com/mysql/1012987-mysql-install-mysql-osx-runs-port-3307-a.html 最后看到上面的文章. In the System Preferences under MySQL, click the 'Automaticall Start MySQl Server on Startup' bo…