[Sw] 使用 Swoole Server task/协程处理大数据量异步任务时注意

关于 Buffered Query 和 Unbuffered Query：http://www.php.net/manual/zh/mysqlinfo.concepts.buffering.php

对于结果集小的查询，一般就开启 Buffered Query 一次取回（fetchAll）；

对于结果集很大的查询，可以开启 Unbuffered Query 来遍历资源一条条 fetch，避免撑爆客户端内存；

PDO 属性设置：http://php.net/manual/zh/pdo.setattribute.php

其它解决方案：

1. 高频投递（依赖进程数），少量处理（每批次数据），可以自己用 Process 实现进程池处理队列任务，或者使用自带的 task 功能。

2. 使用自带 task 功能的情况下，如果 worker 不需要与 task worker 通讯，那么 onTask 不要使用 return 返回数据，减少消耗。

3. worker 使用 task( ) 投递频率必须小于 task 进程数（task_worker_num），可以程序来限制。

　　比方说 $taskWorkerNum 是 50，

　　任务投递次数累加 $deliverNo，

　　onTask 内完成任务时计数 $serv->atomic->add(1)，

　　完成任务数 $serv->atomic->get() 获得。

　　那么在投递之后需要进行判断，投递总数 - 完成数 >= 任务进程数，说明投递次数满了，暂停一会儿，保证 task 进程不是满负荷工作。

/**

 * 调度工作
 * https://cnblogs.com/farwish

 */

public function onWorkerStart(\Swoole\Server $server, $workerId)

{

    if ($workerId == 0) {

        $data = [1, 2, 3];

        foreach ($data as $item) {

            // 限流与投递

            while (($server->deliverNo - $server->atomic->get()) >= $this->taskWorker) {

                echo "等待空闲 task 进程\n";

                sleep(1);

            }

            $server->task($item);

            $server->deliverNo++;

        }

        // 任务结束后退出 server

        while (true) {

            if ($server->deliverNo == $server->atomic->get()) {

                $server->shutdown();

            }

            sleep(1);

        }

    }

}

服务初始化部分：

    public function initTaskServer()

    {

        $server = new \Swoole\Server('0.0.0.0');

        $server->atomic = new \Swoole\Atomic(0);

        $server->deliverNo = 0;

        $server->set([

            'worker_num' => 1,

            'task_worker_num' => $this->taskWorkerNum,

            'task_ipc_mode' => 1,

            'task_max_request' => 5000,

        ]);

        $server->on('workerStart', [$this, 'onWorkerStart']);

        $server->on('task', [$this, 'onTask']);

        $server->on('receive', [$this, 'onReceive']);

        $server->on('finish', [$this, 'onFinish']);

        $server->start();

    }

    protected function onWorkerStart(Server $server, $workerId)

    {

    }

    protected function onTask(Server $server, $taskId, $fromId, $data)

    {

    }

    protected function onReceive(Server $server, $fd, $reactorId, $data)

    {

    }

    protected function onFinish(Server $server, $taskId, $data)

    {

    }

4. 不使用 server 和 task 多进程的情况，利用 swoole 协程中的 channel 实现 producer、consumer 模式，生产者 unbuffer query 持续 push 数据到通道，消费者持续 pop 消费；生产者没有数据时可退出，消费者检测到生产者退出后也随即退出。

缺点是在复杂场景下（比如多层查询再加循环处理），编程会比较困难，比如：等待所有子协程结束的功能（WaitGroup）、多 consumer 的场景，需要自己封装很多组件。

其它：

多进程、多协程的情况下，需要配合使用数据库连接池，因为数据库并发连接数资源有限。

多进程只是利用到了多核，计算密集型场景有优势；协程并发相比更轻量，单进程内利用I/O切换实现并发，适合IO密集型场景。

Course：http://www.yzmedu.com/course/330

Docs：https://wiki.swoole.com/wiki/page/481.html

Link：https://www.cnblogs.com/farwish/p/10242294.html

[Sw] 使用 Swoole Server task/协程处理大数据量异步任务时注意的更多相关文章

Python之路-python(Queue队列、进程、Gevent协程、Select\Poll\Epoll异步IO与事件驱动)
一.进程: 1.语法 2.进程间通讯 3.进程池二.Gevent协程三.Select\Poll\Epoll异步IO与事件驱动一.进程: 1.语法简单的启动线程语法 def run(name): ...
[转]向facebook学习，通过协程实现mysql查询的异步化
FROM : 通过协程实现mysql查询的异步化前言最近学习了赵海平的演讲,了解到facebook的mysql查询可以进行异步化,从而提高性能.由于facebook实现的比较早,他们不得不对php ...
Python3的原生协程(Async/Await)和Tornado异步非阻塞
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_113 我们知道在程序在执行 IO 密集型任务的时候,程序会因为等待 IO 而阻塞,而协程作为一种用户态的轻量级线程,可以帮我们解决 ...
c#中@标志的作用 C#通过序列化实现深表复制细说并发编程-TPL 大数据量下DataTable To List效率对比【转载】C#工具类：实现文件操作File的工具类异步多线程 Async .net 多线程 Thread ThreadPool Task .Net 反射学习
c#中@标志的作用参考微软官方文档-特殊字符@,地址 https://docs.microsoft.com/zh-cn/dotnet/csharp/language-reference/toke ...
C# & SQL Server大数据量插入方式对比
以下内容大部分来自: http://blog.csdn.net/tjvictor/article/details/4360030 部分内容出自互联网,实验结果为亲测. 最近自己开发一个向数据库中插入大 ...
sql server 2005 大数据量插入性能对比
sql server 2005大数据量的插入操作第一,写个存储过程,传入参数,存储过程里面是insert操作, 第二,用System.Data.SqlClient.SqlBulkCopy实例方法, ...
大数据量下的SQL Server数据库自身优化
原文: http://www.d1net.com/bigdata/news/284983.html 1.1:增加次数据文件从SQL SERVER 2005开始,数据库不默认生成NDF数据文件,一般情 ...
[转]Sql server 大数据量分页存储过程效率测试附代码
本文转自:http://www.cnblogs.com/lli0077/archive/2008/09/03/1282862.html 在项目中,我们经常遇到或用到分页,那么在大数据量(百万级以上)下 ...
【SQL server初级】数据库性能优化一：数据库自身优化（大数据量）
数据库优化包含以下三部分,数据库自身的优化,数据库表优化,程序操作优化.此文为第一部分数据库性能优化一:数据库自身优化优化①:增加次数据文件,设置文件自动增长(粗略数据分区) 1.1:增加次数据文 ...

随机推荐

zabbix升级遇到连接不上数据库的问题
问题迁移zabbix-server端时,原来是4.0版本,现在为4.2版本,遇到如下问题解决办法 update dbversion set mandatory=;
【转】Python高级知识点总结
一.可迭代对象.迭代器对象和生成器像list, tuple等这些序列是可以使用for...in ...语句来进行遍历输出的.这是为什么呢?这就需要知道可迭代对象(Iterable).迭代器对象(It ...
android studio 升级到3.3.1后，提示程序包不存在
android studio 升级到3.3.1后,提示程序包不存在原因主Module--A 引用了其他Moduel--B里的jar库, 只需要把B的dependencies改成如下(implent ...
Ubuntu16.04修改IP及时生效
1.Network Connetions 窗口管理器中修改IP 2.ifconfig查看网卡名字 3.刷新IP sudo ip addr flush enp2s0 4.sudo service net ...
mysql原生分页
select * from table limit (pageNo-1)*pageSize, pageSize; 一:分页需求: 客户端通过传递start(页码),limit(每页显示的条数)两个参数 ...
SfMLearner 记录
2019年3月2日09:29:54 正在看SfMLearner的pytorch源码,意识到无监督的深度估计最重要的是利用实体的一致性来建立loss. 对于一个不移动的物体,相机从一个pose到另一个 ...
OkGo3.0 --真实项目使用和二次封装(转)
转载:https://blog.csdn.net/jiushiwo12340/article/details/79011480 11.OkGo3.0真实项目使用和二次封装: ==== 11.OkG ...
EXT.net 图标靠右排列
toolbar1.Items.Add(Button_1); toolbar1.Items.Add(Button_2); toolbar1.Items.Add(Button_3); toolbar1.I ...
C# VS2017的.net Core1.0项目在版本升级为2.0后找不到程序集的处理办法
最近不小心升级了VS2017,然后原来的.net web core1.0的项目是引用了DataBaseLib的程序集,如图 ,升级之后安装了2.0的框架,发现项目就报错了,,这个是还是之后报的错误, ...
Python 有道翻译爬虫有道翻译API 突破有道翻译反爬虫机制
py2.7 #coding: utf-8 import time import random import hashlib import requests while(1): url = 'http: ...

[Sw] 使用 Swoole Server task/协程 处理大数据量异步任务时注意

[Sw] 使用 Swoole Server task/协程 处理大数据量异步任务时注意的更多相关文章

随机推荐

热门专题

[Sw] 使用 Swoole Server task/协程处理大数据量异步任务时注意

[Sw] 使用 Swoole Server task/协程处理大数据量异步任务时注意的更多相关文章