博主在阿里云服务器上安装了主机软件Blesta后,阿里云后台频繁提示CPU超载,打开突发性能模式后,发现CPU负载到了100%。如下图所示:

直接在putty里面reboot整个系统后,负载瞬间降为2%。此时如果一直不访问网页的话,负载将维持在3%附近。如果仅是客户买东西,负载也不会高。

 
但是一旦管理员在后台添加产品,更新支付网关等操作后,负载就立马上来了。所以见使用blesta过程中,强烈建议管理员在后台操作添加产品、更新支付网关后,立马重启服务器,避免阿里云服务器重载运行,造成额外的费用或网站访问变慢。
 
但是过一过段时间后,CPU负载又上来了(阿里云服务器改为CPU限制负载在20%),如下图所示:
 
登录VPS,输入top
 
 
ps -ef|grep 6767后,显示正在执行blesta的cron定时任务index.php

ps -ef|grep 5974后,显示也是在执行blesta的cron定时任务index.php
ps -ef|grep  4915后,同样显示正在执行blesta的cron定时任务index.php
也就是说我们找到原因了,就是cron定时执行blesta的index.php时,导致cpu负载过高。
先kill掉所有的3个cron,把负载降下来。再找原因。
kill -9 5974
kill -9 6767
kill -9  4915
 
原因解释:

原因:定时任务脚本的同步未在规定时间内完成,crontab接下来的还会执行此脚本,很多个php进程,就会导致负载过高,甚至有些服务器会挂掉。(博主突然想到,之前wordpress资源越限也是这个wp-cron.php导致的)
 
根据blesta官方的安装指南:
定时执行php必须要每5分钟执行一次。这个好像太频繁了。官网的Cron Issues也没有过多的涉及这一部分知识。只是提到should run。
 
继续分析这个定时执行的作用,参考同为主机管理软件的whmcs,其关于定时任务的说明为:自动任务对于我们的WHMCS账单系统是非常重要的,用户的续期账单都要靠他提前送达给客户邮箱,虽然默认设定基本可用,但是对他的了解是必须滴。普通设置选定每天一次,然后在命令输入框,输入我们在WHMCS管理后台自动任务设定项目头部提供的命令,然后点击添加新计时程序作业,就可以了。
 
也就是说,我们没必要一直运行cron,但是也需要保证他一直运行。这里我们需要用到一个脚本,即:如果某进程占用CPU超过50%,则自动杀死这个进程。
 
编写checkcpu.sh脚本,实现如果php线程如果占用CPU超过70%且持续60s时,杀死这个进程,具体如下:
#!/bin/sh
# Happytang to monitor used CPU
record=0
while true;
do
cpu=$(top -b -n1 | grep "php" | head -1 | awk '{print $9}')
pid=$(top -b -n1 | grep "php" | head -1 | awk '{print $1}')
#cpu check
result=${cpu/.*}
if [[ $record == $pid ]];then kill -9 $pid;echo "$pid was killed";fi
if [[ $result > 70 || $result == 100 ]];then let record=${pid};else let record=0;fi
#echo
echo `date +%F" "%H:%M:%S`+" cpu:$result% record pid:$record pid:$pid"
sleep 60
done

  最后,运行下述命令,保证退出putty后脚本继续执行

nohup sh ./checkcpu.sh &

  如果需要停止运行这个脚本,则:

ps -ax #查看所有的进程pid
kill -9 pid //杀死一个某个pid

  本文参考了这篇文章这篇文章,首发于Happytang’s Blog

blesta运行造成阿里云服务器CPU频繁超载的原因分析的更多相关文章

  1. 服务器CPU使用率高的原因分析与解决办法

    我们的服务器在使用操作系统的时候,用着用着系统就变慢了,打开“ 任务管理器 ”一看,才发现CPU使用率达到80%以上.这是怎么回事情呢?遇到病毒了吗?硬件有问题?还是系统设置有问题呢?在本文中将从硬件 ...

  2. SQL SERVER数据库服务器CPU不能全部利用原因分析

    背景 客户凌晨把HIS数据库迁移到配置更高的新服务器,上午业务高峰时应用非常缓慢,严重影响到业务运行.   1.现象 通过SQL专家云实时可视化界面看到大量的绿点,绿点表示会话在等待某项资源,绿点越大 ...

  3. 阿里云服务器sshd-D cpu占用过高

    发现阿里云服务器cpu占用到达了100%,原因是被植入了挖矿程序,解决方法如下 1.使用top命令查看进程id 直接kill杀死该进程过一会就会重新启动. 2.查看该进程所在的文件目录 这个文件基本上 ...

  4. 阿里云服务器被挖矿minerd入侵的解决办法

    上周末,更新易云盘的时候,发现阿里云服务器CPU很高,执行 top 一看,有个进程minerd尽然占用了90%多的CPU, 赶紧百度一下,查到几篇文章都有人遇到同样问题 Hu_Wen遇到的和我最相似, ...

  5. 阿里云服务器被挖矿程序minerd入侵的终极解决办法[转载]

    突然发现阿里云服务器CPU很高,几乎达到100%,执行 top c 一看,吓一跳,结果如下: root 386m S : /tmp/AnXqV -B -a cryptonight -o stratum ...

  6. 在阿里云服务器上配置CentOS+Nginx+Python+Flask环境

    在阿里云服务器上配置CentOS+Nginx+Python+Flask环境 项目运行环境 阿里云(单核CPU, 1G内存, Ubuntu 14.04 x64 带宽1Mbps), 具体购买和ssh连接阿 ...

  7. 在阿里云服务器ubuntu14.04运行netcore

    从netcore1.0正式发布就很激动,想要赶紧学习. 最近博客园的一篇文章给了完整的指导非常感谢,但是在实际实现到发布到阿里云服务器遇到一些问题,记录下来. 首先上基础文章http://www.cn ...

  8. 阿里云服务器ubuntu安装java运行环境

    服务器 阿里云服务器ubuntu安装java运行环境 转:http://www.codingyun.com/article/45.html 今天来给大家介绍一下在阿里云ubuntu服务器下安装java ...

  9. 阿里云服务器用Docker配置运行nginx并访问

    一.Docker拉取nginx镜像 docker pull nginx:1.12.2 这里是下载的是nginx的1.12.2版本,其他版本的镜像请访问https://hub.docker.com/r/ ...

随机推荐

  1. Salesforce 学习 | 官方总结最实用的Spring '20新功能

    在Spring '20正式发布之前,Trailblazers 社区举行了一个名为Treasure Hunt的在线活动,通过预览沙盒,分享他们认为Spring ‘20中最重要的功能.这篇文章就来盘点一下 ...

  2. pandas basic cheatsheet

    "胖的要死"是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. 有多大?这篇 ...

  3. 浏览器中 JS 的事件循环机制

    目录 事件循环机制 宏任务与微任务 实例分析 参考 1.事件循环机制 浏览器执行JS代码大致可以分为三个步骤,而这三个步骤的往复构成了JS的事件循环机制(如图). 第一步:主线程(JS引擎线程)中执行 ...

  4. Java数组模拟环形队列

    2.环形队列 (上一篇队列:https://www.cnblogs.com/yxm2020/p/12676323.html) 百度百科 1.假溢出 ​ 系统作为队列用的存储区还没有满,但队列却发生了溢 ...

  5. Mysql使用终端操作数据库

      使用终端操作数据库       1.如何查看有什么数据库?     show databases;        2.如何选择数据库?    use databasesName;       3. ...

  6. Linux工程师必备的系统监控工具

    WGCLOUD基于java语言开发,是微服务架构构建监控系统,支持高并发高性能高可用,核心模块包括:服务器集群监控,ES集群状态监控,CPU监控,内存监控,数据监控(mysql,postgresql, ...

  7. 如何用TensorFlow实现线性回归

    环境Anaconda 废话不多说,关键看代码 import tensorflow as tf import os os.environ['TF_CPP_MIN_LOG_LEVEL']='2' tf.a ...

  8. 探索ORACLE之ASM概念(完整版)

    探索ORACLE之ASM概念(完整版) 本文出自https://www.jb51.net/article/43527.htm ASM是Oracle 10g R2中为了简化Oracle数据库的管理而推出 ...

  9. java中wait和sleep的区别

    文章目录 Wait和sleep的区别 唤醒wait和sleep java中wait和sleep的区别 在本篇文章中,我们将会讨论一下java中wait()和sleep()方法的区别.并讨论一下怎么使用 ...

  10. 基于Atlas实现mysql读写分离

    一.实验环境 主机名IP地址 master192.168.200.111 slave192.168.200.112 atlas192.168.200.113 主从复制不再赘述,链接地址:授权Atlas ...