nodejs高并发大流量的设计实现,控制并发的三种方法

nodejs高并发大流量的设计实现,控制并发的三种方法
eventproxy、async.mapLimit、async.queue控制并发
Node.js是建立在Google V8 JavaScript引擎之上的网络服务器框架，允许开发者能够用客户端使用的语言JavaScript在服务器端编码。
----------------
node.js优缺点：
优点：高并发，io密集型处理，可以作为单页面应用，便于爬虫抓取。
缺点：不适合cpu计算密集型，对关系数据库支持不好

nodejs高并发大流量的设计实现

原理：非阻塞事件驱动实现异步开发,通过事件驱动的I/O来操作完成跨平台数据密集型实时应用
传统的server 每个请求生成一个线程， nodejs是一个单线程的，使用libuv保持数万并发

libuv原理：
c语言编写的基础库实现主循环，文件，网络即可

libuv的改进：
回传上下文信息，其它线程不能访问缺省主循环，loop不支持多线程

代码可读性维护改进：
async：
async.waterfall([getcatalog, getaticle,getTigle])

promise 的方法
koa写法
es6写法使用yield

var titles = []
co(function *() {
var catalog = yield getCatalog(gid)
var articles = yield getArticles(catalog)
titles = yield getTitles(articles)
});

前端优化问题：移除iscorll，合并请求，tcp优化，http优化，localstorate，html5离线缓存
api优化：restfulapi，标准输入输出
ui优化：使用同一的框架，前端组件化
异常处理： log监控，避免大文件处理，retry处理

===================

用eventproxy、async.mapLimit、async.queue控制并发

1.用eventproxy实现控制并发

var EventProxy = require('eventproxy');

const most = 5;//并发数5

var urllist = [....];//待抓取url列表，100个

function foo(start){

    var ep = new EventProxy();

    ep.after('ok',most,function(){

        foo(start+most);//一个批次任务完成，递归进行下一批任务

    });

    var q=0;

    for(var i=start;i<urllist.length;i++){

        if(q>=most){

            break;//最多添加most个任务

        }

        http.get(urllist[i],function(res){

            //....

            res.on('end',function(){

                ep.emit('ok');//一个任务完成，触发一次ok事件

            });

        });

        q++;

    }

}

foo(0);

2.使用 async.mapLimit 控制并发

var async = require('async');

//模拟一组连接地址

var urls = [];

for(var i = 0; i < 30; i++) {

    urls.push('http://datasource_' + i);

}

console.log(urls);

// 并发连接数的计数器

var concurrencyCount = 0;

// 并发抓取数据的过程

var fetchUrl = function (url, callback) {

    // delay 的值在 2000 以内，是个随机的整数

    var delay = parseInt((Math.random() * 10000000) % 2000, 10);

    concurrencyCount++;

    console.log('现在的并发数是', concurrencyCount, '，正在抓取的是', url, '，耗时' + delay + '毫秒');

    setTimeout(function () {

        concurrencyCount--;

        //抓取成功，调用回调函数

        callback(null, url + ' html content');

    }, delay);

};

//使用 async.mapLimit 来 5 个并发抓取，并获取结果

async.mapLimit(urls, 5, function (url, callback) {

    fetchUrl(url, callback);

}, function (err, result) {

    //所有连接抓取成功，返回回调结果列表

    console.log('final:');

    console.log(result);

});

3.使用async.queue 控制并发

"use strict"

var http = require('http');

var cheerio = require('cheerio');

var URL = require('url');

var path = require('path');

var fs = require('fs');

var async = require('async');

var baseUrl = "http://cnodejs.org/";

var targetUrl = "http://cnodejs.org/";

var stime = new Date();

function sGet(url,callback){

  var chunks = [];

  http.get(url,(res)=>{

    if (res.statusCode != '200') {

      callback({message:"抓取失败,状态码:"+res.statusCode,url:url});

      return;

    }

    res.on('data',(chunk)=>{

      chunks.push(chunk);

    });

    res.on('end',()=>{

      callback(null,Buffer.concat(chunks).toString());

    });

  }).on('error',(e)=>{

    callback({message:"抓取失败",url:url,err:e});

  });

}

sGet(targetUrl,(err,data)=>{

  if (err) {

    console.log(err);

    return false;

  }

  var $ = cheerio.load(data);

  var anchors = $("#topic_list a.topic_title");

  console.log('共'+anchors.length+'个任务');

  const most=5;//并发数

    //创建队列并指定并发数

  var q=async.queue(function(url,callback){

    var filename = path.basename(url)+'.txt';

    sGet(url, (err, data)=> {

      if (err) {

        callback(err);

        return false;

      }

      fs.writeFile('./html/' + filename, data, function (err) {

        if (err) {

          throw err;

        }

        callback(null,filename);

      });

    });

  },most);

  q.drain = function() {

    console.log('任务全部完成,共耗时:'+(new Date()-stime)+'ms');

  }

  anchors.each(function(){

    var url = URL.resolve(baseUrl,$(this).attr('href'));

    q.push(url,function(err,filename){

      if (err) {

        console.log(err);

        return;

      }

      console.log("finished:"+filename);

    });

  });

});

nodejs高并发大流量的设计实现,控制并发的三种方法的更多相关文章

高并发大流量专题---11、Web服务器的负载均衡
高并发大流量专题---11.Web服务器的负载均衡一.总结一句话总结: 推荐使用nginx七层(应用层)负载均衡的实现:配置那是相当的简单 http{ upstream cluster{ serv ...
高并发大流量专题---10、MySQL数据库层的优化
高并发大流量专题---10.MySQL数据库层的优化一.总结一句话总结: mysql先考虑做分布式缓存,过了缓存后就做mysql数据库层面的优化 1.mysql数据库层的优化的前面一层是什么? 数 ...
高并发大流量专题---5、CDN加速
高并发大流量专题---5.CDN加速一.总结一句话总结: CDN就是多整几台节点服务器,选距离用户最近的服务器来给用户服务,实现的话可以用阿里云.腾讯云他们提供的功能,简单方便,妈妈再也不用担心我 ...
高并发大流量专题---3、前端优化（减少HTTP请求次数）
高并发大流量专题---3.前端优化(减少HTTP请求次数) 一.总结一句话总结: 图片地图:使用<map><area></area></map>标签. ...
[原创]lvs+ospf+nginx实现高可用大流量web架构
lvs+ospf+nginx实现高可用大流量web架构配置总概述架构图: 配置如下: .quagga之zebra配置: # cat /etc/quagga/zebra.conf ! ! Zebra ...
java 分次读取大文件的三种方法
1. java 读取大文件的困难 java 读取文件的一般操作是将文件数据全部读取到内存中,然后再对数据进行操作.例如 Path path = Paths.get("file path&qu ...
Java并发编程（二）创建线程的三种方法
进程与线程 1. 进程进程和代码之间的关系就像音乐和乐谱之间的关系一样,演奏结束的时候音乐就不存在了但乐谱还在:程序执行结束的时候进程就消失了但代码还在,而计算机就是代码的演奏家. 2. 线程线 ...
php解决与处理网站高并发大流量访问的方法
方法/步骤首先,确认服务器硬件是否足够支持当前的流量普通的P4服务器一般最多能支持每天10万独立IP,如果访问量比这个还要大, 那么必须首先配置一台更高性能的专用服务器才能解决问题 ,否则怎么 ...
高并发下用pdo,文件排它锁,redis三种方法对比
<?php header('content-type:text/html;charset=utf-8'); // //无控制 // $DB_DSN = ' ...

随机推荐

windows环境下命令打到服务中
1.正常redis在本地命令行中启动,现在直接在服务中启动(tomcat同理) cmd下命令如下: sc create redis binPath= D:\redis\redis-server.exe ...
Centos 使用Systemctl报Error getting authority: Error initializing authority: Error calling StartServiceByName for org.freedesktop.PolicyKit1: Timeout was reached (g-io-error-quark, 24)
在使用centos7.4 安装服务的时候报错: Error getting authority: Error initializing authority: Error calling StartSe ...
DOM基础：table（表格）
1. table元素的相关属性 tBodies 一个table可以有多个tBody tHead 一个table只有一个tHead tFoot 一个table只有一个tFoot rows 一个tabl ...
PXC 57 二进制安装
1.准备阶段 1.1 在三个节点上分别创建:用户组用户组目录 --用户组用户组 #/usr/sbin/groupadd mysql #/usr/sbin/useradd -g mysql mys ...
geopandas overlay 函数报错问题解决方案
前言这篇文章依旧是基于上一篇文章(使用Python实现子区域数据分类统计)而写,此文章中介绍了使用 geopandas 的 overlay 函数对两个 GeoDataFrame 对象取相交或相异的部 ...
jquery和ajax和springmvc
<script type="text/javascript" src="js/jquery-1.11.1.js"></script> $ ...
Java之JVM监控工具分享
Java之JVM监控工具分享 JVM的基本知识常用的也就是类加载机制,内存区域.分配.OOM,GC,JVM参数调优几个链接自己看: 内存区域&类加载机制分配策略&垃圾回收算法.收集 ...
点击app分享链接,js判断手机是否安装某款app,有就尝试打开,没有就下载
html: <h1 class="downlink"> 前往 </h1> js: document.addEventListener('DOMContent ...
tcpdf开发文档（中文翻译版）
2017年5月3日15:06:15 这个是英文翻译版,我看过作者的文档其实不太友善或者不方便阅读,不如wiki方便后面补充一些,结构性文档翻译这是一部官方网站文档,剩余大部分都是开发的时候和网络总 ...
Node项目的Restful化
提倡Restful风格的目的或者作用主要是,结构清晰.符合标准.易于理解.扩展方便. 个人把Restful简单粗暴地理解为:路由不包含动词. 怎么做到路由不包含动词呢?答案是,启用常用的GET和POS ...

nodejs高并发大流量的设计实现,控制并发的三种方法

nodejs高并发大流量的设计实现,控制并发的三种方法的更多相关文章

随机推荐

热门专题