brpc 内部实现

thread model

pthread 1:1atomic cache同步降低性能

fiber n:1 -> nginx 多核难以扩展, 用户不能做阻塞操作.

context 存储contextualStack

bthread_make_fcontext (boost::context)手动切换线程上下文->函数栈, 寄存器

bthread_jump_fcontext 将context解包, 恢复上下文

防止栈溢出: 1. mprotect to add a guarding page (并发bthread 过多会导致mmap失败)

2.use mmap to alloc page-aligned memory

schedule 每一个pthread有一个taskgroup

basic-> run_queue(FIFO)

remotetaskqueue->备份二级队列, 向队列中提交不在btrhead中创建的任务

taskgroup逻辑

while not stop
wait until signaled
work stealing from other
sched_to(that_bthread)
work stealing
  1. futex_wait_private(value, expect) #atomic 系统调用原语 Parkinglot封装, wait signal

  2. 避免全局竞争的方法:

    很多个parkinglot, 进行worker分组, 改成局部竞争, 只唤醒组内部分worker

  3. workstealingqueue: 从这个队列里偷

TaskControl
  • 单例管理所有的taskgroups
  • 如果bthread在non-worker的pthreads中创建的时候, task_control选择一个taskgroup, 把这个btrhead写到remoteTaskQueue中
  • signal-task 唤醒通知一部分worker来偷
  • steal-task 从所有taskgroup中偷, 避免饿死
bthread执行优先级

local queue->remote queue->other worker local queue->other worker remote taskqueue

bthread_t

32bit 版本号(防止aba问题) + 32bit slot id(resourcepool中的下标)->taskMeta bthread的管理结构

start_foreground ->set_mained(ready_to_run + sched_to) 直接跑新的, 正在跑的放队尾

start_background ->ready_to_run

阻塞操作

yield -> 把当前运行环境空出来, 加到queue尾

usleep()->把当前任务从runqueue pop 定时加到remote_queue

bthread_id
  • client端, 标记每个requestid用来区分response
  • 保证rpc context 线程安全
  • 用来cancel rpc
  • 防止ABA问题
  • 具体来说,bthread_id解决的问题有:

    • 在发送RPC过程中response回来了,处理response的代码和发送代码产生竞争。
  • 设置timer后很快触发了,超时处理代码和发送代码产生竞争。

  • 重试产生的多个response同时回来产生的竞争。

  • 通过correlation_id在O(1)时间内找到对应的RPC上下文,而无需建立从correlation_id到RPC上下文的全局哈希表。
  • 取消RPC。
运行
  1. eventDispatcher:run EPOLLIN epoll bthread
  2. 当前线程起一个bthread, read/cut messages 这样没有专门的io线程, 避免全局竞争, 如果某个callback阻塞, 其他线程会吧read/cut 偷走继续运行
  3. callback 业务函数

对于每个fd, 最多有一个I和O bthread

注意:

在brpc中加mutex锁, brpc请求下游模块, 没有worker资源处理下游返回的read..无法释放mutex锁

buffer management->IOBuf

IOBuf->BlockRef->Block 三层结构

非连续的存储, 每个block引用计数, 避免频繁new, 使用cache in TLSData

timer keeping

定时器分桶, 每个结构要存的: task_list, mutex, _nearest_run_time 无锁无竞争

拿到所有定时器时, _nearset_run_time建一个全局堆

while not stop
check each bucket for new tasks
build a heap (remove deleted tasks)
pop first task from heap
run if timeout
cal the next timeout
futex_wait_private(如果有更紧急的timer插入, 会唤醒timer线程)

Memory management 专用分配, 固定size

BlockGroup / Block / T 类似于buddy 算法

resourceid = group_idex + block_offset + slot_offset

I/O model

naming & load balancer

  • control reverse 观察者模式, 服务器变化后,由naming调用lb中 add, remove, reset三个接口
  • DoublyBufferedData, TLS lock每次读前台时, 后台切换时, 从每个线程lock一个锁, 读完之后切换

Bvar & sampling

每个写bvar的时候, 只写tls . 读的时候combine.

brpc internal的更多相关文章

  1. 尝试brpc来升级rpc服务,测试应用过程

    照着官方文档来,不过在mac下还是有些小坑 对熟悉c++的人来说很小儿科,但对c++相对比较外行 (只知道基本语法和部分数据结构)的人,还是作不到开箱即用 首先编译```If you need to ...

  2. myeclipse 内存不够用报错PermGen space 和 An internal error has occurred.

    最近项目中又增加了新的模块,项目的代码又多了不少.运行的时候总是报如下错误 Exception in thread "http-apr-80-exec-6" java.lang.O ...

  3. swift 中关于open ,public ,fileprivate,private ,internal,修饰的说明

    关于 swift 中的open ,public ,fileprivate,private, internal的区别 以下按照修饰关键字的访问约束范围 从约束的限定范围大到小的排序进行说明 open,p ...

  4. idea报错:error java compilation failed internal java compiler error

    idea下面报如下问题 error java compilation failed internal java compiler error 解决办法:Setting->Compiler-> ...

  5. AutoMapper对internal访问级别属性的映射

    最近在使用DDD重新搭建公司内部OA的架构,具体情况搭好了应该会写一下,这里说的是今天遇到的问题. 先简单说一下相关的几个部分: 1.聚合.聚合分成了两个模块:一个包含审批单据等估计至少今年不会怎么变 ...

  6. Tcl internal variables

    Tcl internal variables eryar@163.com 在Tcl中内置了一些变量,并赋予了一定的功能.内置变量列表如下: 变量名称 功能描述 argc 指命令行参数的个数. argv ...

  7. c++ builder 2010 错误 F1004 Internal compiler error at 0x9740d99 with base 0x9

    今天遇到一个奇怪的问题,拷贝项目后,在修改,会出现F1004 Internal compiler error at 0x9740d99 with base 0x9 ,不管怎么改,删除改动,都没用,关闭 ...

  8. ORA-00600: internal error code, arguments: [4194]

    使用PlateSpin复制出来的一数据库服务器(Oracle 10g)在启动数据库实例时遇到"ORA-00600: internal error code, arguments: [4194 ...

  9. MDK st-link下载STM32程序出现Internal command error和Error:Flash download failed. Target DLL

    MDK st-link下载STM32程序出现Internal command error和Error:Flash download failed. Target DLL   是因为目标板的芯片处于休眠 ...

  10. HTTP 错误 500.21 - Internal Server Error 解决方案

    不久前重新安装了Windows7,在安装了VS2010 开发平台之后,将网站发布到IIS,访问发生如下错误: HTTP 错误 500.21 - Internal Server Error处理程序“Ni ...

随机推荐

  1. git解决一个电脑多用户情况(win7)

    首先:在输入ssh-keygen -t rsa -C "注册邮箱"后不要急着按enter,此时输入秘钥对的文件名,不要跟默认文件重名(默认的是id_rsa)

  2. 在技术圈混,不知道这些你就 OUT 了

    技术之路就是漫长的打怪升级,不断学习前人的踩坑经验才能提升自己,切忌闭门造车.所谓独乐乐不如众乐乐,强烈推荐以下公众号,让你的生活多点意思,希望小伙伴们能在 coding 的路上走的更远. OSC开源 ...

  3. Linux 服务器更换主板后,网卡识别失败的处理方法

    上周日,由于断电,公司所在的集群服务器在关机断电重启后,发现唯一的一个登陆节点主板出现了故障,以致于 log 登陆节点的 Red Hat Enterprise 6 系统无法启动. 由于集群是生信所有分 ...

  4. 【Python&RS】GDAL对栅格数据重采样/对齐栅格

            GDAL(Geospatial Data Abstraction Library)是一个在X/MIT许可协议下的开源栅格空间数据转换库.它利用抽象数据模型来表达所支持的各种文件格式.它 ...

  5. 10个 Istio 流量管理 最常用的例子,你知道几个?

    10 个 Istio 流量管理 最常用的例子,强烈建议收藏起来,以备不时之需. 为了方便理解,以Istio官方提供的Bookinfo应用示例为例,引出 Istio 流量管理的常用例子. Bookinf ...

  6. idea设置退出软件提示

    进入设置

  7. 逍遥自在学C语言 | 指针陷阱-空指针与野指针

    前言 在C语言中,指针是一种非常强大和灵活的工具,但同时也容易引发一些问题,其中包括空指针和野指针. 本文将带你了解这两个概念的含义.产生原因以及如何避免它们所导致的问题. 一.人物简介 第一位闪亮登 ...

  8. 文件系统考古 3:1994 - The SGI XFS Filesystem

    在 1994 年,论文<XFS 文件系统的可扩展性>发表了.自 1984 年以来,计算机的发展速度变得更快,存储容量也增加了.值得注意的是,在这个时期出现了更多配备多个 CPU 的计算机, ...

  9. MODBUS-TCP转Ethernet IP 网关连接空压机 配置案例

      本案例是工业现场应用捷米特JM-EIP-TCP的Ethernet/IP转Modbus-TCP网关连接欧姆龙PLC与空压机的配置案例.使用设备:欧姆龙PLC,捷米特JM-EIP-TCP网关, ETH ...

  10. 即构SDK12月迭代:新增多项质量回调,互动白板、云录制SDK同步更新

    即构SDK12月迭代来啦,本月LiveRoom/AudioRoom SDK新增了端到端延迟质量回调.房间会话ID信息,便于在音视频通话.直播场景中进行时延.通话质量的评测.同时还优化了硬件设备权限变更 ...