mysql小白系列_03 体系结构-线程池

thread pool的原理是什么？
为什么用double write就能解决page坏的问题？
Innodb redo log 与 binlog有什么区别？有了Innodb redo log为什么还要binlog？

1. thread pool的原理是什么？

高并发、高性能
- 每一个连接到数据库都需要CPU分配线程栈，进行身份验证、建立上下文信息、执行请求、返回结果，关闭连接，释放资源
- 并发访问时，资源会被不断请求和释放，请求释放会大量消耗资源，导致资源率用率降低
- 线程池预先创建一定是数量的线程，当有请求访问时，从线程池中分配一个线程提供服务，请求结束后，该线程又去服务其他请求，避免了线程和内存对象的频繁创建和释放，提高资源利用率，减少上下文切换和资源竞争

上下文信息指的是进程的描述信息，就是当前进程相关的寄存器内容、内存页表内容
用于当前进程被再次执行的时候，可以得到上次切换时的状态继续执行下去

mysql是单进程多线程的服务
mysql5.6以前：

采用的是One-Connection-Per-Thread，每线程一连接当请求连接进来时，分配一个独立的线程，完成请求后销毁进程，再来请求，再分配线程
高并发下，会导致线程的频繁创建销毁，资源被浪费
thread-cache可以缓存线程，供下次使用，但无法解决高连接数问题高连接数：高并发、高内存消耗、更多上下文切换、服务抖动

Thread-pool

线程处理的最小单位是statement，就是语句，一个线程可以处理多个连接请求。

3种连接管理方式

No-Threads
主要用于调试，the server uses a single thread to handle one connection
One-Thread-Per-Connection
the server uses one thread to handle each client connection
dynamically-loaded
If the thread pool plugin is enabled, the server sets the thread_handling value to dynamicallyloaded.

thread pool参数

mysql> show variables like 'thread%';

+--------------------+---------------------------+

| Variable_name      | Value                     |

+--------------------+---------------------------+

| thread_cache_size  |                         |

| thread_concurrency |                         |

| thread_handling    | one-thread-per-connection |

| thread_stack       |                     |

+--------------------+---------------------------+

 rows in set (0.01 sec)

thread_cache_size 缓存起来可重用的线程数目
默认值是： 8 + max_connections / 100

How many threads the server should cache for reuse. When a client disconnects, the client's threads are put in the cache if there are fewer than thread_cache_size threads there. Requests for threads are satisfied by reusing threads taken from the cache if possible, and only when the cache is empty is a new thread created.

mysql> show variables like '%max_connections%';

+-----------------+-------+

| Variable_name   | Value |

+-----------------+-------+

| max_connections |   |

+-----------------+-------+

 row in set (0.00 sec)

thread_concurrency 5.7以后已经删除

This variable is specific to Solaris 8 and earlier systems, for which mysqld invokes the thr_setconcurrency() function with the variable value. This function enables applications to give the threads system a hint about the desired number of threads that should be run at the same time. Current Solaris versions document this as having no effect.

thread_handling 使用的线程池模型
thread_stack 每个线程堆栈大小，也就是么给线程被创建的时候，mysql给他分配的内存空间，单位是byte

The stack size for each thread.

thread_pool_size 社区版没有这个参数

thread_pool_size: The number of thread groups in the thread pool. This is the most important
parameter controlling thread pool performance. If the primary storage engine is InnoDB, the optimal thread_pool_size setting is likely to be between 16 and 36, with the most common optimal values tending to be from 24 to 36. We have not seen any situation where the setting has been optimal beyond 36. There may be special cases where a value smaller than 16 is optimal.

mysql> show status like 'connections';

+---------------+-------+

| Variable_name | Value |

+---------------+-------+

| Connections   |      |

+---------------+-------+

 row in set (0.00 sec)

mysql启动共接收的连接次数

mysql> show status like 'thread%';

+-------------------+-------+

| Variable_name     | Value |

+-------------------+-------+

| Threads_cached    |      |

| Threads_connected |      |

| Threads_created   |      |

| Threads_running   |      |

+-------------------+-------+

 rows in set (0.00 sec)

Threads_cached 缓存的连接线程个数

Threads_connected 客户端已经连接上的线程个数

Threads_created 共创建的连接线程个数

Threads_running 与客户端活动的连接线程个数

查看进程的线程个数,使用pstack/pstree

yum install gdb,psmisc -y

IO多路复用 I/Om ultiplexing(select and poll)

IO 写入经过两步骤
- 第一步等待数据准备好
- 第二部将数据从kernel中复制到进程

一个mysql数据包从网络到达服务器，首先被拷贝到系统kernel的buffer区域，然后再从kernel的buffer区域拷贝到应用程序的buffer，这里的应用程序应该指的是mysql。

阻塞
- 通常IO的操作指的是数据的读取、写入
- 当进程准备读取数据到buffer或者从cache写入数据disk，当发现数据没准备好，那么进程就会被挂起，也就是阻塞
- 当数据准备好了，进程开始工作，阻塞期间，CPU则被浪费

2. 为什么用double write就能解决page坏的问题？

什么是doublewrite？
指的是innodb存储引擎在写数据到表空间的时候，会写2次，写到日志文件只有1次

mysql将脏数据flush到datafile的时候，先用memcopy将脏数据复制到内存的double write buffer上
然后通过double write buffer写到共享表空间（一个文件），然后马上调用fsync函数，同步到磁盘上
如果发生断电等原因造成carsh，page没完全写入对应的数据文件，那么就从double write buffer进行数据恢复

关于存储的概念

sector扇区（windows里叫簇）

[root@docker02 ~]# fdisk -l|grep Sector

Sector size (logical/physical):  bytes /  bytes

IO block 磁盘操作的逻辑单位块大小

[root@docker02 ~]# blockdev --getbsz /dev/mapper/centos-home

OS blcok 操作系统存储数据的块大小

[root@docker02 ~]# getconf PAGESIZE

DB block 数据库存储数据的块大小

mysql> show variables like 'innodb_page_size';

+------------------+-------+

| Variable_name    | Value |

+------------------+-------+

| innodb_page_size |  |

+------------------+-------+

 row in set (0.00 sec)

DB里的page指的是DB存储数据的块大小，也就是db block size

page问题

一个DB block写到磁盘的时候，会落在多个OS block，最终落在一个IO的一个或者多个扇区上 block上，也就是可能会产生部分页写到了磁盘上。

double write恢复机制

double write buffer本身写失败，就是实例中的内存写失败，则重新从磁盘load数据进来，然后通过inndob事务日志进行数据redo
double write buffer写成功，就是写文件成功，但是写数据文件最终存储失败，则double write buffer再写一次
恢复的时候，innodb比较页面page的checksum值，如果不一致，通过load数据+事务的方式计算出正确的数据

3. Innodb redo log 与 binlog有什么区别？有了Innodb redo log为什么还要binlog？

binlog是mysql服务启动后的server层记录
- 记录的是事务的变更操作，不仅仅支持innodb，还支持其他存储引擎
- 属于逻辑记录
- 记录对数据的更改或者潜在更改
- For replication
- Certain data recovery operations require use of the binary log
- 在事务最终commit前写入binlog？？？？根据sync_binlog值刷入磁盘
redolog是innodb存储引擎使用的
- 记录的是该引擎自己的事务，没有mysql，一样可以运行存储数据
- 日志内容是关于每个页更改的物理情况，属于物理记录
- 数据最终被写入磁盘时，先写入到redolog

参考：

http://blog.csdn.net/guolong1983811/article/details/50421857

https://www.cnblogs.com/cchust/p/3961260.html

mysql小白系列_03 体系结构-线程池的更多相关文章

Java并发编程系列-(6) Java线程池
6. 线程池 6.1 基本概念在web开发中,服务器需要接受并处理请求,所以会为一个请求来分配一个线程来进行处理.如果每次请求都新创建一个线程的话实现起来非常简便,但是存在一个问题:如果并发的请求数 ...
并发编程系列：Java线程池的使用方式，核心运行原理、以及注意事项
并发编程系列: 高并发编程系列:4种常用Java线程锁的特点,性能比较.使用场景线程池的缘由 java中为了提高并发度,可以使用多线程共同执行,但是如果有大量线程短时间之内被创建和销毁,会占用大量的 ...
mysql小白系列_09 mysql性能优化关键点
一服务器参数调优,有哪些关键点? 1. 应用访问优化优化方法性能提升效果优化成本说明减少数据访问能不访问就不访问-减少磁盘IO 1~1000 低缓存服务器缓存mysql数据,Redis. ...
【java线程系列】java线程系列之java线程池详解
一线程池的概念及为何需要线程池: 我们知道当我们自己创建一个线程时如果该线程执行完任务后就进入死亡状态,这样如果我们需要在次使用一个线程时得重新创建一个线程,但是线程的创建是要付出一定的代价的,如果在 ...
java多线程系列六、线程池
一. 线程池简介 1. 线程池的概念: 线程池就是首先创建一些线程,它们的集合称为线程池. 2. 使用线程池的好处 a) 降低资源的消耗.使用线程池不用频繁的创建线程和销毁线程 b) 提高响应速度,任 ...
elasticsearch 5.x 系列之二线程池的设置
1,概述每个Elasticsearch节点内部都维护着多个线程池,如index.search.get.bulk等,用户可以修改线程池的类型和大小,以及其他的比如reflesh, flush,warm ...
线程池系列一：线程池作用及Executors方法讲解
线程池的作用: 线程池作用就是限制系统中执行线程的数量. 根据系统的环境情况,可以自动或手动设置线程数量,达到运行的最佳效果:少了浪费了系统资源,多了造成系统拥挤效率不高.用线程池控制线程数量 ...
（Java多线程系列九）线程池
线程池 1.什么是线程池线程池是指在初始化一个多线程应用程序过程中创建一个线程集合,然后在需要执行新的任务时重用这些线程而不是新建一个线程.线程池中线程的数量通常取决于可用内存数量和应用程序的需求. ...
Android进阶——多线程系列之四大线程池的使用介绍
线程池一直是初学者最抵触的东西,由于刚开始学习做项目并不会涉及到线程池的使用,但是不去学习它,心里又好像有个石头一直沉着,一直放心不下,其实是很简单的东西,早晚都要学,不如趁现在吧.由于文章从初学者的 ...

随机推荐

QtConcurrent::run() 只能运行参数个数不超过5的函数
有时不得不看源码 qtconcurrentrun.h template <typename T, typename Param1, typename Arg1, typename Param2, ...
痞子衡嵌入式：揭秘i.MXRT1170 eFuse空间访问可靠性的保护策略(冗余与ECC)
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是恩智浦i.MXRT1170的eFuse空间访问可靠性保护策略. 关于i.MXRT系列的eFuse/OTP,痞子衡之前在介绍Boot时写过 ...
华为设备RIP实施和理论详解
1.路由协议基础共同的目的:更新.维护和控制3层的路由工作机制: RIP,封装在UDP这个协议上,端口号520(优先级100) OSPF,封装在IP层,协议号89(优先级,内部10,外部是150- ...
对包含HttpContext.Current.Cache的代码进行单元测试
假设我们如下代码调用了HttpContext.Current.Cache 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 public class CacheManager { ...
#Week5 Regularization
一.The Problem of Overfitting 欠拟合(high bias):模型不能很好地适应训练集: 过拟合(high variance):模型过于强调拟合原始数据,测试时效果会比较差. ...
CF思维联系–CodeForces - 225C. Barcode(二路动态规划)
ACM思维题训练集合 Desciption You've got an n × m pixel picture. Each pixel can be white or black. Your task ...
P1458 顺序的分数 Ordered Fractions（有技巧的枚举）+C++类封装=精简代码
题目描述输入一个自然数N,对于一个最简分数a/b(分子和分母互质的分数),满足1<=b<=N,0<=a/b<=1,请找出所有满足条件的分数. 这有一个例子,当N=5时,所有解 ...
「newbee-mall新蜂商城开源啦」前后端分离的 Vue 版本即将开源
新蜂商城 Vue 版本 2019 年 10 月份我在 GitHub 开源仓库中上传了新蜂商城项目的所有源码,至今已经有小半年的时间了,感兴趣的可以去了解一下这个 Spring Boot 技术栈开发的商 ...
Navicat12.1系列安装，破解以及破解navicat报错的解决方案
由于上课的需要,我们必须自己下载并安装 Navicat Premium 12,虽然安装过程很简单,但是安装后的navicat只能试用,并没有永久激活,然而我还想永久使用,所以就各种百度,因为不断地遇到 ...
F - Watching Fireworks is Fun
C. Watching Fireworks is Fun 题目大意: 一个城镇有n个区域,从左到右1-n,每个区域之间距离1个单位距离.节日中有m个烟火要放,给定放的地点a[ i ].时间t[ i ] ...

mysql小白系列_03 体系结构-线程池

1. thread pool的原理是什么？

3种连接管理方式

thread pool参数

IO多路复用 I/Om ultiplexing(select and poll)

2. 为什么用double write就能解决page坏的问题？

关于存储的概念

DB里的page指的是DB存储数据的块大小，也就是db block size

page问题

double write恢复机制

3. Innodb redo log 与 binlog有什么区别？有了Innodb redo log为什么还要binlog？

mysql小白系列_03 体系结构-线程池的更多相关文章

随机推荐

热门专题