平滑重启是指能让我们的程序在重启的过程不中断服务,新老进程无缝衔接,实现零停机时间(Zero-Downtime)部署;

平滑重启是建立在优雅退出的基础之上的,之前一篇文章介绍了相关实现:Golang中使用Shutdown特性对http服务进行优雅退出使用总结

目前实现平滑重启的主要策略有两种:

方案一:我们的服务如果是多机器部署,可以通过网关程序,将即将重启服务的机器从网关下线,重启完成后再重新上线,该方案适合多机器部署的企业级应用;

方案二:让我们的程序实现自启动,重启子进程来实现平滑重启,核心策略是通过拷贝文件描述符实现子进程和父进程切换,适合单机器部署应用;

今天我们就主要介绍方案二,让我们的程序拥有平滑重启的功能,相关实现参考一个开源库:https://github.com/fvbock/endless

实现原理介绍

http 连接介绍:

我们知道,http 服务也是基于 tcp 连接,我们通过 golang http 包源码也能看到底层是通过监听 tcp 连接实现的;

func (srv *Server) ListenAndServe() error {
if srv.shuttingDown() {
return ErrServerClosed
}
addr := srv.Addr
if addr == "" {
addr = ":http"
}
ln, err := net.Listen("tcp", addr)
if err != nil {
return err
}
return srv.Serve(tcpKeepAliveListener{ln.(*net.TCPListener)})
}

复用 socket:

当程序开启 tcp 连接监听时会创建一个 socket 并返回一个文件描述符 handler 给我们的程序;

通过拷贝文件描述符文件可以使 socket 不关闭继续使用原有的端口,自然 http 连接也不会断开,启动一个相同的进程也不会出现端口被占用的问题;

通过如下代码进行测试:

package main

import (
"fmt"
"net/http"
"context"
"time"
"os"
"os/signal"
"syscall"
"net"
"flag"
"os/exec"
) var (
graceful = flag.Bool("grace", false, "graceful restart flag")
procType = ""
) func main() {
flag.Parse()
mux := http.NewServeMux()
mux.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) { fmt.Fprintln(w, fmt.Sprintf("Hello world! ===> %s", procType))
})
server := &http.Server{
Addr: ":8080",
Handler: mux, } var err error
var listener net.Listener
if *graceful {
f := os.NewFile(3, "")
listener, err = net.FileListener(f)
procType = "fork process"
} else {
listener, _ = net.Listen("tcp", server.Addr)
procType = "main process" //主程序开启5s 后 fork 子进程
go func() {
time.Sleep(5*time.Second)
forkSocket(listener.(*net.TCPListener))
}() } err=server.Serve(listener.(*net.TCPListener)) fmt.Println(fmt.Sprintf("proc exit %v", err))
} func forkSocket(tcpListener *net.TCPListener) error {
f, err := tcpListener.File()
if err != nil {
return err
} args := []string{"-grace"}
fmt.Println(os.Args[0], args)
cmd := exec.Command(os.Args[0], args...)
cmd.Stdout = os.Stdout
cmd.Stderr = os.Stderr
// put socket FD at the first entry
cmd.ExtraFiles = []*os.File{f}
return cmd.Start()
}

该程序启动后,等待 5s 会自动 fork 子进程,通过 ps 命令查看如图可以看到有两个进程同时共存:

然后我们可以通过浏览器访问 http://127.0.0.1/ 可以看到会随机显示主进程或子进程的输出;

写一个测试代码进行循环请求:

package main

import (
"net/http"
"io/ioutil"
"fmt"
"sync"
) func main(){ wg:=sync.WaitGroup{}
wg.Add(100)
for i:=0; i<100; i++ {
go func(index int) {
result:=getUrl(fmt.Sprintf("http://127.0.0.1:8080?%d", i))
fmt.Println(fmt.Sprintf("loop:%d %s", index, result))
wg.Done()
}(i)
}
wg.Wait()
} func getUrl(url string) string{
resp, _ := http.Get(url)
defer resp.Body.Close()
body, _ := ioutil.ReadAll(resp.Body)
return string(body)
}

能看到返回的数据也是有些是主进程有些是子进程。

切换过程:

在开启新的进程和老进程退出的瞬间,会有一个短暂的瞬间是同时有两个进程使用同一个文件描述符,此时这种状态,通过http请求访问,会随机请求到新进程或老进程上,这样也没有问题,因为请求不是在新进程上就是在老进程上;当老进程结束后请求就会全部到新进程上进行处理,通过这种方式即可实现平滑重启;

综上,我们可以将核心的实现总结如下:

1.监听退出信号;

2.监听到信号后 fork 子进程,使用相同的命令启动程序,将文件描述符传递给子进程;

3.子进程启动后,父进程停止服务并处理正在执行的任务(或超时)退出;

4.此时只有一个新的进程在运行,实现平滑重启。

一个完整的 demo 代码,通过发送 USR1 信号,程序会自动创建子进程并关闭主进程,实现平滑重启:

package main

import (
"fmt"
"net/http"
"context"
"os"
"os/signal"
"syscall"
"net"
"flag"
"os/exec"
) var (
graceful = flag.Bool("grace", false, "graceful restart flag")
) func main() {
flag.Parse()
mux := http.NewServeMux()
mux.HandleFunc("/", func(w http.ResponseWriter, r *http.Request) { fmt.Fprintln(w, "Hello world!")
})
server := &http.Server{
Addr: ":8080",
Handler: mux, } var err error
var listener net.Listener
if *graceful {
f := os.NewFile(3, "")
listener, err = net.FileListener(f)
} else {
listener, err = net.Listen("tcp", server.Addr)
}
if err != nil{
fmt.Println(fmt.Sprintf("listener error %v", err))
return
} go listenSignal(context.Background(), server, listener) err=server.Serve(listener.(*net.TCPListener))
fmt.Println(fmt.Sprintf("proc exit %v", err))
} func forkSocket(tcpListener *net.TCPListener) error {
f, err := tcpListener.File()
if err != nil {
return err
} args := []string{"-grace"}
fmt.Println(os.Args[0], args)
cmd := exec.Command(os.Args[0], args...)
cmd.Stdout = os.Stdout
cmd.Stderr = os.Stderr
// put socket FD at the first entry
cmd.ExtraFiles = []*os.File{f}
return cmd.Start()
} func listenSignal(ctx context.Context, httpSrv *http.Server, listener net.Listener) {
sigs := make(chan os.Signal, 1)
signal.Notify(sigs, syscall.USR1) select {
case <-sigs:
forkSocket(listener.(*net.TCPListener))
httpSrv.Shutdown(ctx)
fmt.Println("http shutdown")
}
}

使用 apache 的 ab 压测工具进行验证一下,执行 ab -c 50 -t 20 http://127.0.0.1:8080/ 持续 50 的并发 20s,在压测的期间向程序运行的pid发送 USR1 信号,可以看到压测结果,没有失败的请求,由此可知,该方案实现平滑重启是木有问题的。

最后给大家安利一个 Web 开发框架,该框架已经将平滑重启进行的封装,开箱即用,快速构建一个带平滑重启的 Web 服务。

框架源码:https://gitee.com/zhucheer/orange

文档:https://www.kancloud.cn/chase688/orange_framework/1448035

Gong服务实现平滑重启分析的更多相关文章

  1. yarn关于app max attempt深度解析,针对长服务appmaster平滑重启

    在YARN上开发长服务,需要注意fault-tolerance,本篇文章对appmaster的平滑重启的一个参数做了解析,如何设置可以有助于达到appmaster平滑重启. 在yarn-site.xm ...

  2. 【学习笔记】启动Nginx、查看nginx进程、查看nginx服务主进程的方式、Nginx服务可接受的信号、nginx帮助命令、Nginx平滑重启、Nginx服务器的升级

     1.启动nginx的方式: cd /usr/local/nginx ls ./nginx -c nginx.conf 2.查看nginx的进程方式: [root@localhost nginx] ...

  3. 启动Nginx、查看nginx进程、nginx帮助命令、Nginx平滑重启、Nginx服务器的升级

    1.启动nginx的方式: cd /usr/local/nginx ls

  4. golang 服务平滑重启小结

    背景 golang 程序平滑重启框架 supervisor 出现 defunct 原因 使用 master/worker 模式 背景 在业务快速增长中,前期只是验证模式是否可行,初期忽略程序发布重启带 ...

  5. Centos--swoole平滑重启服务

    平滑重启: 已经打开的服务: 首先在server服务中为进程添加名字: /** * @param $server */ public function onStart($server) { swool ...

  6. Golang学习--平滑重启

    在上一篇博客介绍TOML配置的时候,讲到了通过信号通知重载配置.我们在这一篇中介绍下如何的平滑重启server. 与重载配置相同的是我们也需要通过信号来通知server重启,但关键在于平滑重启,如果只 ...

  7. node.js cluster多进程、负载均衡和平滑重启

    1 cluster多进程 cluster经过好几代的发展,现在已经比较好使了.利用cluster,可以自动完成子进程worker分配request的事情,就不再需要自己写代码在master进程中rob ...

  8. Nginx的平滑重启和平滑升级

    一,Nginx的平滑重启如果改变了Nginx的配置文件(nginx.conf),想重启Nginx,可以发送系统信号给Nginx主进程的方式来进行.在重启之前,要确认Nginx配置文件的语法是正确的. ...

  9. Nginx 的启动、停止、平滑重启、信号控制和平滑升级

    Nginx 的启动         假设 nginx 安装在 /usr/local/nginx 目录中,那么启动 nginx 的命令就是: [root@localhost ~]# /usr/local ...

随机推荐

  1. Zero down time upgrade with OGG -from 11g to 12c.

    High level steps upgrade from 11g to 12c database: 1)    Check network between source and target. 2) ...

  2. java面试| 线程面试题集合

    集合的面试题就不罗列了,基本上在深入理解集合系列已覆盖 「 深入浅出 」java集合Collection和Map 「 深入浅出 」集合List 「 深入浅出 」集合Set 这里搜罗网上常用线程面试题, ...

  3. web api 的 安全 认证问题 , 对外开放 的 时候 需要考虑到安全的问题

    关于 OWIN OAuth , web api的认证,全局验证, 安全方面的验证 有必要 去 自己捣鼓一下.

  4. Vim学习之路1

    与之前的随笔一样,这个也是记录Vim常用命令以供日后查找所用.对于Vim,简介而又功能强大,学习之后代码书写相当愉快. 1. 保存并退出 :wq 2. 进入标准插入模式退出命令模式 i 3. 退出标准 ...

  5. Educational Codeforces Round 81 (Rated for Div. 2) B. Infinite Prefixes

    题目链接:http://codeforces.com/contest/1295/problem/B 题目:给定由0,1组成的字符串s,长度为n,定义t = sssssss.....一个无限长的字符串. ...

  6. initramfs打包集成rootfs到image镜像及linux rootfs的正常启动

    最近的项目中需要在仿真机haps及VDK上集成rootfs,中间遇到一些问题,在此整理记录以备忘. rootfs里面集成的busybox版本1.29.3 (buildroot环境中自带) kernel ...

  7. 文件上传三:base64编码上传

    介绍三种上传方式: 文件上传一:伪刷新上传 文件上传二:FormData上传 文件上传三:base64编码上传 Flash的方式也玩过,现在不推荐用了. 优点: 1.浏览器可以马上展示图像,不需要先上 ...

  8. K8S生产环境中实践高可靠的配置和技巧都有哪些?

    K8S环境中实践高可靠的配置和技巧都有哪些? 磁盘类型及大小 磁盘类型: 推荐使用ssd 磁盘 对于worker节点,创建集群时推荐使用挂载数据盘.这个盘是专门给/var/lib/docker 存放本 ...

  9. Python 类中方法的内部变量,命名加'self.'变成 self.xxx 和不加直接 xxx 的区别

    先看两个类的方法: >>> class nc(): def __init__(self): self.name ='tester' #name变量加self >>> ...

  10. 根据范围爬TMS规则瓦片

    因为需要简单写了一个下载地图的爬虫,代码如下: #coding=utf-8 import urllib.request import os import socket import zlib impo ...