背景: 之前做了一个项目,需要在容器内访问宿主机提供的Redis 服务(这是一个比较常见的应用场景哈), 常规方案: ①   主机网络(docker run --network=host): 完全应用主机网络堆栈,在容器内localhost就是指向宿主机 ②   网桥网络(docker run --network=bridge):  这也是docker容器默认的网络通信模式,容器内localhost 指向的是容器自身,不能使用 localhost 访问宿主机上localhost:6379承载的R…
一.故障现象 我们团队访问腾讯云上部署的测试环境中的Web系统A时,偶尔会出现类似于网络闪断的情况,浏览器卡很久没有反应,最终报Connection Timeout. 不过奇怪的是,当团队中的某个人无法访问A时,其他人仍然可以正常访问.而且无法访问的这个人如果利用VPN,找一台其他地方的主机为跳板,也可正常访问A. 而且该故障发生几率较低,持续时间也较短,一般稍等片刻即可自行恢复.所以,很长一段时间以来,该故障均没有引起重视,只是被我们简单的认为可能是运营商网络质量问题. 直到最近发生几率越来越…
记一次KUBERNETES/DOCKER网络排障 https://coolshell.cn/articles/18654.html 记得之前在一个公众号里面看过这个文章 讲的挺好的.. 物理机直接跑docker 有利有弊 如果出了问题之后 很难通过重启解决 因为影响面积太大 如果加上一层虚拟化的话 虽然有一定的损耗 但是能避免一些 单一环境的严重问题. 昨天周五晚上,临下班的时候,用户给我们报了一个比较怪异的Kubernetes集群下的网络不能正常访问的问题,让我们帮助查看一下,我们从下午5点半…
https://coolshell.cn/articles/18654.html 总结在前面: 1.kill -9杀死docker进程,系统一定是要遍历所有的docker子进程来一个一个发退出信号的,这个过程可能会非常的长,结果客户没等到遍历完直接Ctrl+C结束了kill,导致一些docker的进程被杀死,这些docker的子进程就被挂载到PID 1下了,其中docker的NAT进程一直还在,所以出现的现象就是IP地址冲突. 2.上面的问题,重启必然能解决~~所以重启是万能法宝 3.一台物理服…
前导 上次Redis MQ分布式改造完成之后, 编排的容器稳定运行了一个多月,昨天突然收到ETL端同事通知,没有采集到解析日志了. 赶紧进服务器看了一下,用于数据接收的receiver容器挂掉了, 尝试docker container start [containerid],  几分钟后该容器再次崩溃. 初步排查: redis连接超限 docker log [containerid]  查看了容器日志: Microsoft.AspNetCore.Mvc.Internal.ControllerAc…
首先,这本书是Linux.CN赠送的,多谢啦~ http://linux.cn/thread-12733-1-1.html http://linux.cn/thread-12754-1-1.html   先贴一下当时读样章时的感想: 在阅读前言时,还以为这是一本专注于带领开发人员学习Linux系统运维的书籍,后来发现正文内容以排除故障的通用手段为切入点,进而引申到Linux系统各类系统故障的排除的具体方式.这些内容不仅可以引导开发人员进入DevOps的大门,更可以修正运维人员的排障方式和方法,还…
http://blog.csdn.net/chinalinuxzend/article/details/1799279 1.网络调试工具概说: 如 果我们把一台机器接入网络中,通过网络配置工具的配置这时就要用到网络调试工具,目的是判断机器是否已经接入到网络以及网络连接是否正常.我们常 用的在各个发行版通用的网络配置工具是ifconfig和netconfig,当然Linux各大发行版本又有自己的配置工具,这些特定发行版特别的配置 工具是非常有效的,大多是图形界面的,操作也非常之简单. 有关网络配置…
网络不通 先ping自己 在ping网关 再ping外网 再ping别人的ip 背景需求 Linux 因为其强大的网络处理能力,被广泛用于网关(实例链接)和服务器(实例链接).实际工作中,快速排查这些 Linux 设备的网络故障成为解决问题的利器.为此,本文列出高频使用的 Linux 排查网络故障的命令. 诊断系统资源 CPU: uptime, top, sar -u RAM: free, top, sar -r Disk: iostat, sar -b, df -h, du -S /home…
目录 学习笔记:CentOS7学习之十八:Linux系统启动原理及故障排除 18.1 centos6系统启动过程及相关配置文件 18.1.1 centos6系统启动过程 18.1.2 centos6启动相关的配置文件 18.2 centos7系统启动过程及相关配置文件 18.2.1 centos7系统启动过程 18.2.2 Systemd运行原理-了解一下 18.2.3 管理系统服务 18.2.4 运行级别 18.2.5 运行级别的切换 18.2.6 grub2和grub区别-了解 18.3 实…
尽管Linux系统非常强大,稳定,但是我们在使用过程当中,如果人为操作不当,仍然会影响系统,甚至可能使得系统无法开机,无法运行服务等等各种问题.那么这篇博文就总结一下一些常见的故障排除方法,但是不可能面面俱到,只能不断的补充,更新. 一.管理员忘记密码 (1).重启计算机,进入单用户模式 1 2 3 4 5 [root@CentOS5 grub]# reboot   Broadcast message from root (pts/2) (Wed Dec  2 18:45:32 2015):  …
尽管Linux系统非常强大,稳定,但是我们在使用过程当中,如果人为操作不当,仍然会影响系统,甚至可能使得系统无法开机,无法运行服务等等各种问题.那么这篇博文就总结一下一些常见的故障排除方法,但是不可能面面俱到,只能不断的补充,更新. 一.管理员忘记密码 (1).重启计算机,进入单用户模式 1 2 3 4 5 [root@CentOS5 grub]# reboot   Broadcast message from root (pts/2) (Wed Dec  2 18:45:32 2015):  …
有许多可能的原因会导致 SSH 客户端无法访问 VM 上的 SSH 服务. 如果已经执行了较常规的 SSH 故障排除步骤,则需要进一步排查连接问题. 本文指导用户完成详细的故障排除步骤,以确定 SSH 连接失败的位置以及解决方法. 采取预备步骤 下图显示了与错误相关的组件. 以下步骤帮助用户查明失败的原因,并得出解决方法或应对措施. 在门户中检查 VM 的状态. 在 Azure 门户中,选择“虚拟机” > “VM 名称”. VM 的状态窗格应显示“正在运行” . 向下滚动以显示计算.存储和网络资…
尝试连接到 Linux 虚拟机 (VM) 时,有多种原因可能会导致安全外壳 (SSH) 错误.SSH 连接失败或被拒绝. 本文帮助用户找出原因并更正问题. 可以使用 Azure 门户.Azure CLI 或适用于 Linux 的 VM 访问扩展来排查和解决连接问题. Note Azure 具有用于创建和处理资源的两个不同的部署模型:Resource Manager 和经典. 这篇文章介绍了如何使用这两种模型,但 Azure 建议大多数最新部署使用 Resource Manager 模型. 如果对…
内容整理自官方开发文档 系列 1 分钟快速使用 Docker 上手最新版 Sentry-CLI - 创建版本 快速使用 Docker 上手 Sentry-CLI - 30 秒上手 Source Maps Sentry For React 完整接入详解 Sentry For Vue 完整接入详解 Sentry-CLI 使用详解 Sentry Web 性能监控 - Web Vitals Sentry Web 性能监控 - Metrics Sentry Web 性能监控 - Trends Sentry…
一.VLAN故障排除 故障排除的三步骤:故障定位 → 分析故障 → 排除故障 一般情况下,网络设备配置的故障有两种排错方式 A.静态排错:主要靠display查看配置信息的方式进行 在相关vlan下display this或display总配置文件 扩展:对VLAN传输的流量进行监控: [Huawei] vlan vlan-id [Huawei-vlan-id] statistic enable   //开启VLAN的监控 [Huawei] display vlan vlan-id statis…
windows和linux下的docker运行时的网络结构是有区别的 a.windows下,默认使用Hyper-v创建一个linux虚拟机,承载docker.所以从外向内的路径为: windows -> linux系统的docker(hyper-v中) -> docker内的容器(应用) 其中docker desktop会默认创建一个网络DockerNAT,windows宿主分配IP:10.0.75.1 linux虚拟机会分配IP:10.0.75.2,并且还另外会分配内部网段IP:172.17…
我们在工作中应用了docker容器化技术,服务的部署.维护和扩展都方便了很多.然而,近期在私有化部署过程中,由于不同服务器环境的复杂多变,常常遇到网络方面的问题,现象为容器服务运行正常,但宿主机.容器之间网络不通. 本篇博客旨在总结: Linux虚拟网络及docker网络的基础知识 遇到网络问题时排查问题思路 常用指令和工具的使用 以上三部分作为之后的参考,本篇文章也将会在日后实践过程中逐渐补充.本篇为第一篇,主要介绍基础知识 Linux网络虚拟化基础 Network Namespace 网络命…
以下脚本推荐放在定时任务里,写好cron表达式,在不影响业务系统的情况下dump一些信息分析系统性能瓶颈以及故障排除. 因为每次dump的时候jvm会暂停(几秒到几十秒不等).所以在生产系统使用时慎用.因此遭成的任何损失与本博主无关. crontab -e * 21-8/1 * * * /var/erp/data/dump.sh >> /var/erp/data/dump.log 2>&1 (脚本未经验证) dump.sh #!/bin/bash PID=`ps -ef|grep…
首先这次网络故障是断电引起的 我给大家画个模型 三层的为八口交换机 一层的为五口打印机 笔记本代表两台无线打印机 首先八口的连接了公司采购电脑一台,业务电脑一台,其他电脑三台 第二个五口交换的连接财务电脑两台 最后一个五口交换机连接两台无线打印机,其他电脑一台 红圈电脑 青色打印机 紫色交换机 大八口 小五口 路由器最后一个颜色,自己找 1我首先用笔记本一个一个口试试,看看哪里联网,最后我确定是交换机出了问题,想一把换掉,换这两个,本人也是一个萌新,没处理过,也有猜测的意思 2本来可能直接换交换…
本系列文章会深入研究 Ceph 以及 Ceph 和 OpenStack 的集成: (1)安装和部署 (2)Ceph RBD 接口和工具 (3)Ceph 物理和逻辑结构 (4)Ceph 的基础数据结构 (5)Ceph 与 OpenStack 集成的实现 (6)QEMU-KVM 和 Ceph RBD 的 缓存机制总结 (7)Ceph 的基本操作和常见故障排除方法 学以致用,本文将介绍 Ceph 集群的一些基本操作和常见的故障排除方法. 0. 测试环境 将由 Virtulbox 管理的两个虚机,分别是…
一.查看以及测试网络 查看及测试网络配置是管理Linux网络服务的第一步,本节将学习Linux系统中的网络查看以及测试命令.其中讲解的大多数命令以普通用户权限就可以完成操作,但是普通用户在执行"www.qixoo.qixoo.com/Sbin/"目录下的命令时需要指定命令文件的绝对路径. (一)查看网络配置 使用ifconfig命令-查看网络接口地址 主机的网络接口卡(网卡)通常称为"网络接口".在Linux系统中,使用ifconfig命令可以查看网络接口的地址配置…
基本的故障排除错误 故障的排除一定是先简单后复杂的,有的人把上述的文件反复配置,就是上不了网,一直都认为是系统出了故障,想重装机子.结果发现原来是网线压根就没插上. 排错要慢慢的按部就班的来: (1)首先看网线是否插好,灯亮就是OK的.(2)我们要看自己的网卡驱动是否正常,建立一个ip然后ping它,看是否ping的通,通过说明网卡是正常的.(3)使用ifconfig命令查看ip是否正确,路由信息是否正确(4)ping统一网段的机子,不行的话网关设置错误(5)查看dns的状态(这个是经常出现的,…
转自:http://int32bit.me/2016/05/04/Linux%E5%B8%B8%E7%94%A8%E7%BD%91%E7%BB%9C%E5%B7%A5%E5%85%B7%E6%80%BB%E7%BB%93/ 目录 ping netstat lsof iftop nc tcpdump telnet ifconfig nslookup & dig whois route ip brctl  traceroute mtr ss python curl wget axel nethogs…
1. DNS故障诊断的常用工具或命令 诊断DNS解析故障的四个常用命令工具: ①unbound-checkconf:用于检查unbound服务器配置文件的语法错误 ②unbound-control:是一个用于控制远程Unbound服务器的工具. ③nscd(name service cache daemon,名称服务缓存管理器):一种专门对DNS缓存进行管理的工具(RHEL7中默认未安装,可使用yum -y install nscd命令安装). ④dig(Domain Information G…
当容器分布在多个不同的主机上时,这些容器之间的相互通信变得复杂起来.容器在不同主机之间都使用的是自己的私有IP地址,不同主机的容器之间进行通讯需要将主机的端口映射到容器的端口上,而且IP地址需要使用主机的IP地址.Weave正是为了解决这个问题而出现的,它把不同主机上容器互相连接的网络虚拟成一个类似于本地网络的网络. Weave是在一个网络的基础上,构建了一层由软件定义的网络层,这个网络看起来就像是一个本地的局域网,但是实际上它的底层通过另一个网络进行通信.这个网络可能会比实际物理局域网的可靠性…
本文提供详细的故障排除步骤,用于为基于 Windows 的 Azure 虚拟机诊断和修复复杂的远程桌面错误. Important 若要消除更常见的远程桌面错误,请务必先阅读远程桌面的基本故障排除文章,然后再继续. 你可能遇到不像基本远程桌面故障排除指南中所述的任何特定错误消息的远程桌面错误消息. 请遵循以下步骤来确定远程桌面 (RDP) 客户端为何无法连接到 Azure VM 上的 RDP 服务. Note Azure 具有用于创建和处理资源的两个不同的部署模型:Resource Manager…
大纲: 一.RHEL6系统启动原理 BIOS--->mbr--->bootloader--->内核--->init--->/etc/rc.d/rc.sysinit--->/etc/rc.d/rc[0-6].d--->/etc/rc.d/rc.local--->/bin/login 二.启动故障排除 1.防止恶意破解root密码(grub加密) 2.系统崩溃后,如何备份数据到U盘(救援模式) 3.inode结点满了怎么办 4.双系统,更新grub ======…
第十九节 Linux相关网络知识梳理 标签(空格分隔): Linux实战教学笔记-陈思齐 一,前言 一个运维有时也要和网络打交道,所以具备最基本的网络知识,对一个运维人员来说是必要的.但,对于我们的工作来说这些并不是重点,因此,我不可能从最基础的网络知识开始讲起.本节内容更多是从一个梳理和总结的角度进行阐述.如若同学们遇到不懂,或不明白的地方,那么你要留心了,你有很多基础性的网络知识还不具备,我建议从网上有针对性的学习一下. 二,网络基础学习体系 思科课程体系的大致浏览(CCNA),虽然知识不多…
有多种原因可导致无法启用或连接到在 Azure 虚拟机 (VM) 上运行的应用程序.原因包括应用程序未在预期端口上运行或侦听.侦听端口受到阻止,或网络规则未将流量正确传递到应用程序.本文说明有条理地找到问题并更正问题. 如果在使用 RDP 或 SSH 连接到 VM 时发生问题,请先参阅以下文章之一: 对与基于 Windows 的 Azure 虚拟机的远程桌面连接进行故障排除 对于基于 Linux 的 Azure 虚拟机的 Secure Shell (SSH) 连接进行故障排除 Note Azur…
centos6中boot文件被全部删除的故障排除 /boot文件里关于启动的核心文件有三个,/vmlinuz-2.6.32-696.e16.x86_64,initramfs-2.6.32-696.el6.x86_64.img,grub.conf 方法一: 开机进入救援模式 chroot    /mnt/sysimgage/       切根     mount   /dev/sr0 /mnt      挂载光盘 cp /mnt/ioslinux/vmlinuz   /boot/    拷贝vml…