引言 上一篇文章我们围绕如何合理利用资源的主题做了一些最佳实践的分享,这一次我们就如何提高服务可用性的主题来展开探讨. 怎样提高我们部署服务的可用性呢?K8S 设计本身就考虑到了各种故障的可能性,并提供了一些自愈机制以提高系统的容错性,但有些情况还是可能导致较长时间不可用,拉低服务可用性的指标.本文将结合生产实践经验,为大家提供一些最佳实践来最大化的提高服务可用性. 如何避免单点故障? K8S 的设计就是假设节点是不可靠的.节点越多,发生软硬件故障导致节点不可用的几率就越高,所以我们通常需要给服…