server_patrol.sh服务器巡查脚本】的更多相关文章

Linux生产服务器Shell脚本分享 2012-6-6 86市场网 linux 作为一名Linux/unix系统管理员,我经常遇到人问这个问题:shell能做什么?PHP这么强大,为什么不用PHP来完成工作呢?其实相对于PHP这些开发语言而言,shell主要用于数据库备份(SVN备份).计划任务(crontab).服务状态监控.FTP远程备份等.对于这些任务,shell的强大是大家都公认的,这也是每一个Linux/unix系统管理员的基本之一.现在在Windows 2008里也出现了Power…
为了方便日常运维写的一段简单脚本,用于集中获取服务器操作系统.CPU.内存使用.负载.硬盘使用.网络信息. 脚本比较简单,就不解释了,有兴趣的朋友请自行查看. #!/bin/bash##Name:system_info#Ver:1.0#Author:lykyl###程序说明:#获取服务器基本信息脚本#echo '[OS Info]'echo 'Host Name: '`uname -n`echo 'OS: '`cat /etc/redhat-release`echo 'Kernel: '`una…
JAVA执行远端服务器的脚本 问题描述 实现思路 技术要点 代码实现 问题描述 工作中遇到这样一个问题,我们的应用为了实现高可用会采取双机部署,拓扑图大致如下: 这种方案可以简单的保证高可用,即便应用服务器或者数据库服务器其中一台宕机,整个系统的功能还是不会受到影响,但是这里会出现一个问题:例如当应用服务器1宕机了,所有的负载集中到应用服务器2上以后,因为系统功能是正常的,而作为产品交付客户后也没有现场的实施或运维人员在,我们并不知道有一台服务器已经宕机了,所以,我们要实现一个简单的监控,去查看…
1.jar包同级目录 , 如下: #!/bin/sh RESOURCE_NAME=demo.jar tpid=`ps -ef|grep $RESOURCE_NAME|grep -v grep|grep -v kill|awk '{print $2}'` if [ ${tpid} ]; then echo 'Stop Process...' kill -15 $tpid fi sleep 5 tpid=`ps -ef|grep $RESOURCE_NAME|grep -v grep|grep -v…
前提说明:spring boot 应用打包成jar包之后要部署到Linux服务器上面运行,我用的nohup java -jar 命令,但是代码更新之后重新部署的时候覆盖原来的项目,又要手动运行ps -ef|grep jar包名 去查找进程,然后kill -9  去kill进程,有时候nohup进程老是kill不掉,只能多试几次,烦不胜烦..后来专门花时间研究了一下脚本和本地window上传文件到linux服务器的命令,整合了一个启动脚本,顿时项目部署变得无比简单,一分钟内在线上的代码就可以更新了…
1.问题出现 一大早刚起床,阿里云就给我发了一条短信,提醒我服务器出现紧急安全事件:挖矿程序 阿里云“贴心”地提供了解决方法,不过需要购买企业版的安全服务,本着能自己动手就不花钱原则自己搞了起来 于是赶紧上网查资料解决,相似的问题好多,都是被这些脚本变成了挖矿的“肉鸡” 2.问题排查 1)首先top命令查看到占用CPU最多的进程bioset,判断这个就是所谓的挖矿进程 这里经过网上资料提醒,经过攻击后控制台输出变得不可信,因为病毒很可能重定向或者篡改.隐藏你的输出,有一个busybox可以解决这…
1.原理:通过limit的参数,限制新定义的服务器.即可给新买的服务器初始化优化.(如下图所示) 首先我们编写一个总入口的palybook脚本: init.yml --- - hosts: all user: root gather_facts: true roles: - ../../init 第二步:创建相对应的目录.这些目录都有各自的功能. mkdir {file,tasks,vars}                // 具体的目录和功能,可以上网查一下. 第三步:进入到vars目录下定…
一年总有那么几次莫明停电,公司的服务器经不起这样的折腾 写了一个断电后UPS备用电源自动关机的脚本 原理就是检测路由器网关是否能ping通,长时间持续ping不通视为停电了 路由器不要接到ups上 用法     1.检测网关是否持续ping不通300次(forever模式,添加到启动任务即可)        sudo ./ups_check forever 192.168.1.1 300    2.检测网关是否持续ping不通30次(once模式,需要配合crond使用)       sudo…
背景 由于后端微服务架构,于是各种业务被拆分为多个服务,服务之间的调用采用RPC接口,而Nacos作为注册中心,可以监听多个服务的状态,比如某个服务是否down掉了.某个服务的访问地址是否改变.以及流量分配降级等等.(nacos注册中心的由来及原理) 运维架构用的是K8S,由于之前没有做服务高可用的特性,K8S上服务挂掉后不会自动重启. 所以测试过程中,某个接口有问题,可能最先需要排查该服务或依赖服务是否正常可用. 问题 上面说到,测试过程中还需要查看服务是否正常,这是很浪费时间的,特别是环境不…
server服务器每1个小时更新一次时间,server服务器旗下同步服务器每5秒钟同步一次时间,同步服务器与外网不做交互,由server服务器进行同步时间.所以保证每一台同步服务器时间一致. #vi ud_ntp.sh #!/bin/bash time= ip(){ echo "192.168.48.114" echo "192.168.28.233" } stp(){ /etc/init.d/ntpd stop } upd(){ ntpdate us.pool.n…