celery的使用

1.celery的任务调度

# -*- coding: utf-8 -*-

import threading

from bs4 import BeautifulSoup

from tornado import httpclient

from celery import Celery

from tornado.httpclient import HTTPClient

broker = 'redis://localhost:6379'

backend = 'redis://localhost:6379'

app = Celery('tasks', broker=broker, backend=backend)

visited = {}

@app.task

def get_html(url):

    http_client = HTTPClient()

    try:

        response = http_client.fetch(url, follow_redirects=True)

        return response.body

    except httpclient.HTTPError as e:

        return None

    finally:

        http_client.close()

def start(url):

    threads = []

    for i in range(20):

        t = threading.Thread(target=schedule, args=(url,))

        t.daemon = True

        t.start()

        threads.append(t)

    for thread in threads:

        thread.join()

def process_html(url, html):

    print url + ": " + html

    _add_links_to_queue(url, html)

def schedule(url):

    print "before call _work " + url

    _worker.delay(url)

    print "after call _work " + url

def _add_links_to_queue(url, html):

    soup = BeautifulSoup(html)

    links = soup.find_all('a')

    for link in links:

        try:

            _url = link['href']

        except:

            pass

        if not _url.startswith('http'):

            _url = 'http://' + _url

        print url + "==>" + _url

        schedule(_url)

@app.task

def _worker(url):

    print str(threading.currentThread()) + " running " + url

    while 1:

        if url in visited:

            continue

        result = get_html.delay(url)

        try:

            html = result.get(timeout=5)

        except Exception as e:

            print(url)

            print(e)

        finally:

            process_html(url, html)

            visited[url] = True

if __name__ == '__main__':

    start("http://www.hao123.com/")

2.celery如何进行负载均衡设计

celery有send_task方式去做任务调度，因此，负载均衡的话，可以采用自己的算法去做任务分配，可参考：http://blog.csdn.net/vintage_1/article/details/47664187

celery的使用的更多相关文章

异步任务队列Celery在Django中的使用
前段时间在Django Web平台开发中,碰到一些请求执行的任务时间较长(几分钟),为了加快用户的响应时间,因此决定采用异步任务的方式在后台执行这些任务.在同事的指引下接触了Celery这个异步任务队 ...
celery使用的一些小坑和技巧(非从无到有的过程)
纯粹是记录一下自己在刚开始使用的时候遇到的一些坑,以及自己是怎样通过配合redis来解决问题的.文章分为三个部分,一是怎样跑起来,并且怎样监控相关的队列和任务:二是遇到的几个坑:三是给一些自己配合re ...
tornado+sqlalchemy+celery,数据库连接消耗在哪里
随着公司业务的发展,网站的日活数也逐渐增多,以前只需要考虑将所需要的功能实现就行了,当日活越来越大的时候,就需要考虑对服务器的资源使用消耗情况有一个清楚的认知. 最近老是发现数据库的连接数如果 ...
celery 框架
转自:http://www.cnblogs.com/forward-wang/p/5970806.html 生产者消费者模式在实际的软件开发过程中,经常会碰到如下场景:某个模块负责产生数据,这些数据 ...
celery使用方法
1.celery4.0以上不支持windows,用pip安装celery 2.启动redis-server.exe服务 3.编辑运行celery_blog2.py !/usr/bin/python c ...
Celery的实践指南
http://www.cnblogs.com/ToDoToTry/p/5453149.html Celery的实践指南 Celery的实践指南 celery原理: celery实际上是实现了一个典 ...
Using Celery with Djang
This document describes the current stable version of Celery (4.0). For development docs, go here. F ...
centos6u3 安装 celery 总结
耗时大概6小时. 执行 pip install celery 之后, 在 mac 上 celery 可以正常运行, 在 centos 6u3 上报错如下: Traceback (most recent ...
celery 异步任务小记
这里有一篇写的不错的:http://www.jianshu.com/p/1840035cb510 自己的"格式化"后的内容备忘下: 我们总在说c10k的问题, 也做了不少优化, 然 ...
Celery 框架学习笔记
在学习Celery之前,我先简单的去了解了一下什么是生产者消费者模式. 生产者消费者模式在实际的软件开发过程中,经常会碰到如下场景:某个模块负责产生数据,这些数据由另一个模块来负责处理(此处的模块是 ...

随机推荐

“永恒之蓝"漏洞的紧急应对--毕业生必看
早上6点多起床了,第一次起这么早,昨天晚上12点多,看到了一则紧急通知,勒索软件通过微软"永恒之蓝"漏洞针对教育网进行了大规模的攻击,而且有很多同学中招.中招后的结果如下图所示. ...
[刷题]算法竞赛入门经典(第2版) 4-7/UVa509 - RAID!
书上具体所有题目:http://pan.baidu.com/s/1hssH0KO 代码:(Accepted,0 ms) //UVa509 - RAID! #include<iostream> ...
Linux上rpm方式安装JDK1.7
说明: 1.Linux版本 CentOS6.5_x86 2.Java版本 JDK1.7 32位的rpm包,所以是以rpm方式安装的java 3.可以使用yum install java从yum源中安装 ...
Gulp文档入门的文档
Gulp自动化执行文件的操作首先gulp基于node开发的,先按照node.js,使用npm sudo npm install -g gulp (在全局的范围安装 gulp) gulp --help ...
Git版本控制，rsync同步文件，完成线上部署
之前项目开发完成,测试阶段,借着此时,由于公司暂时用两台aliyun ecs 做业务层,所以每次都需要同步线上文件,进而想着搞一搞服务器端(小公司,新项目,先小搞一把),搭建一套小的版本控制上线的 ...
Linux环境g++编译GDAL动态库
一.编译步骤解压下载的GDAL源程序,并在命令行中切换到解压目录. tar -xzvf gdal-2.1.3.tar.gz cd gdal-2.1.3 GDAL可通过configure来实现一些自定 ...
Java中 EvenQueue.invokeLater用法
在Java中Swing是线程不安全的,是单线程的设计,这样的造成结果就是:只能从事件派发线程访问将要在屏幕上绘制的Swing组件.事件派发线程是调用paint和update等回调方法的线程,它还是事件 ...
Javascript & JQuery读书笔记
Hi All, 分享一下我学JS & JQuery的读书笔记: JS的3个不足:复杂的文档对象模型(DOM),不一致的浏览器的实现和便捷的开发,调试工具的缺乏. Jquery的选择器 a. 基 ...
小程序API录音后Silk格式转码MP3
问题客户端使用小程序,需要录音功能然后到后台页面播放,由于微信提供的录音API压缩后的格式为 .silk格式的,但是这个格式其他播放器都是播放不了的,更何况html页面的audio标签更是不可能播放 ...
DATA VISUALIZATION – PART 1
Introduction to Data Visualization – Theory, R & ggplot2 The topic of data visualization is very ...

celery的使用

celery的使用的更多相关文章

随机推荐

热门专题