场景描述: 直接安装出现如下异常: root@ae2d02e458f3:/home# apt-get install python3.6 Reading package lists... Done Building dependency tree Reading state information... Done E: Unable to locate package python3.6 E: Couldn't find any package by glob 'python3.6' E: Co…
场景描述: 应用程序运行在 Docker环境中,经常使用的查看后台日志的命令是:docker attach 容器名该命令优点:实时输出:不足之处:日志大量输出的时候,屏幕一闪而过,不便于调试,并且有一个比较严重的问题,就是该命令在某些容器环境下,由于配置不同,ctrl+c命令退出的时候,会直接导致该容器停止. 其实,docker自身是集成封装了一些关于查看日志的命令的,组合使用,可帮助日常快速定位问题: * 显示所有 log * 显示实时 log * 使用 tail 查看 log 尾部 * 使用…
场景描述: 镜像来源,dockerhub odoo官方镜像:https://hub.docker.com/_/odoo odoo镜像运行一段时间后,出现下述异常,可能是触发某个未知bug:该现象在生产部署的时候出现过一次,为防止再次出现,记录如下分析及处理过程. 执行命令:docker exec -u root -it odoo /bin/bash 日志出现如下错误,无法进入容器: OCI runtime exec failed: exec failed: container_linux.go:…
场景描述: 新部署的容器环境,终端执行python命令,提示没有该命令. 从报错异常可以看出,可能是python环境未安装. 分析思路: 检查python路径: 方式一:type -a python 方式二: ls -l /usr/bin/pythonls -l /usr/bin/python* 方式三: which python 如果输出空或者no such file or directory, 则说明未安装. 处理过程: 不同Linux系统版本安装方式不同! Ubuntu/Debian/Mi…
场景描述: 1. 服务器运行一段时间后,发现系统盘磁盘空间在不断增加,一开始的时候,不会影响系统,随着时间的推移,磁盘空间在不断增加,直到有一天你会发现系统盘剩余空间即将使用完,值得庆幸的是,如果您使用的云服务器,那么服务器支持资源动态扩容,但是如果是物理服务器,那么就要及时处理该问题了:不过话说回来,即便是云服务器支持在线磁盘空间扩容,这样的异常问题,也应及时处理,总不能,一到磁盘空间满的时候,就去扩容. 处理思路:     先以正常的问题定位思路来:(后续知道原理,可直接定位,命令如下: )…
在linux日常运维中,我们平时会用到很多常规的操作命令. 查看服务器的外网ip [root@redis-new01 ~]# curl ifconfig.me [root@redis-new01 ~]# curl ifconfig.me/all  添加主机名 centos6修改主机名 [root@localhost ~]# hostname kevin-web01 [root@localhost ~]# vim /etc/sysconfig/network HOSTNAME= kevin-web…
上篇针对操作系统.主机配置.容器镜像.容器运行时四大方面分享一些Docker的运维经验,本篇将着重在Docker Daemon参数和权限两个方面进一步分享.(阅读上篇请点击右侧:新IT运维时代 | Docker运维之最佳实践-上篇) Docker Daemon为Docker的守护进程,大致可以分为Docker Server.Engine和Job三部分.Docker Daemon可以认为是通过Docker Server模块接受Docker Client的请求,并在Engine中处理请求,然后根据请…
Linux系统运维笔记(四),CentOS 6.4安装 MongoDB 1,下载 https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-3.0.6.tgz 2,解压后,用SecureFXPortable.exe  工具,上传到服务器目录     /usr/local/mongodb3 3,在目录 /usr/local/mongodb3/bin 目录下创建 data目录,用于数据存储. 4,起动 /usr/local/mongodb3/bin/…
Linux系统运维笔记(6),CentOS 7.6双网卡路由配置. 一,先确认系统版本: [root@localhost ~]# cat /etc/redhat-releaseCentOS Linux release 7.6.1810 (Core) 二,网卡1配置外网,配IP地址.子网掩码.和网卡. 网卡2配置内网,配IP地址,子网掩码,不要配网关. 三,写路由表route-网卡名,在via后指定内网的网关. [root@localhost ~]# vi /etc/sysconfig/netwo…
运维笔记--postgresql占用CPU问题定位 场景描述: 业务系统访问变慢,登陆服务器查看系统负载并不高,然后查看占用CPU较高的进程,发现是连接数据库的几个进程占用系统资源较多. 处理方式: 查找出占用系统内存&CPU排名前10的进程:[或者用top命令查看]  ---这里需要注意,如果用了容器,需要进入容器内部查看相应的进程. ps aux|head -1;ps aux|grep -v PID|sort -rn -k +3|head 切换到postgres用户,执行psql,进入数据库…
Linux系统运维笔记(五),CentOS 6.4安装java程序 用eclipse编译通的java程序,现需要实施到服务器.实施步骤: 一,导出程序成jar包. 1,在主类编辑界面点右健,选  run Configurations . 2,填项目名.选主类名,后提交 运行. 3,在项目上点右健,导出,导出时选runnable jar file. 4,Launch configuration 选刚刚运行的配置.Export destination,选导入文件位置.其它默认,导出文件. 二,将ja…
Linux系统运维笔记(四),CentOS 6.4安装Nginx 1,安装编译工具及库文件 yum -y install make zlib zlib-devel gcc-c++ libtool openssl openssl-devel 2,安装 PCRE  ,PCRE 作用是让 Nginx 支持 Rewrite 功能. # yum install -y pcre pcre-devel 3,从官方地址(http://nginx.org/)下载 解压 #tar -zxvf nginx-1.10.…
Linux系统运维笔记(三),设置IP和DNS 手工配置静态的IP地址 也就是手工配置IP地址.子网掩码.网关和DNS. vi /etc/sysconfig/network-scripts/ifcfg-eth0 编辑本地网卡的配置文件 主要查看下面这几项是否和下面给出的一致即可. ONBOOT=yes BOOTPROTO=none IPADDR=192.168.1.66 NETMASK=255.255.255.0 GATEWAY=192.168.1.1 DNS1=192.168.1.1 第二项,…
Linux系统运维笔记 Linux文件编辑命令 首先我们使用命令 vi filename 打开一个文件,这个时候进入到的是命令模式 接下来我们按i,然后键盘随便输入写内容. 然后按ESC重新进入到命令模式. 在命令模式的情况下,我们按:,进入到了末行模式. 输入wq!,然后回车,强行保存退出. q! [强制退出不保存]q[退出不保存]wq[退出并保存后面也可以加个!] vi /etc/centos-release 查看centos系统版本…
Linux系统运维笔记 查看系统版本和设置系统时间 查看系统版本 lsb_release -a (适用于所有的linux,包括Redhat.SuSE.Debian等发行版,但是在debian下要安装lsb) 一步到位,设置系统时间: date -s "20091112 18:30:50" &&hwclock --systohc 查看时区和时间 date //CST:中国标准时间(China Standard Time) //UTC:协调世界时,又称世界标准时间,简称UT…
Ubuntu环境下非root用户指定版本Python的安装及虚拟环境virtualenv的使用 参考博客: https://blog.csdn.net/leviopku/article/details/81219260 https://blog.csdn.net/u013250410/article/details/84788981 实验室不给root权限是对的...不然我们这种代码小白分分钟就删库自刎了. 于是由于没有root权限,便无法更新实验室的python包和各种深度学习库,需要安装自己…
最近不少小伙伴后台联系,希望能弄一些大厂的学习资料,我这边费了很大劲,联系到老朋友,原美团点评架构师张sir,问他要了些美团点评架构的内部资料. 这份资料含金量非常高,包含整个美团点评架构架构图,Linux应用场景,优化方案,学习笔记等等,是不可多得的Linux学习资料,PPT一共60多页,顺手截了2张都是干货! 自动化运维笔记资料 另外,还要到了非常详细的运维自动化全套笔记,从自动化场景分析到相关运维自动化工具,再到ansible全套笔记.和运维性能优化,几乎覆盖了 Linux 云计算学习的方…
场景描述: 日常开发or生产环境经常会需要安装指定版本的软件,出于和其他软件的配合兼容性,以及稳定性的考虑. 现在我们的需求是安装指定版本的RabbitMQ,版本号: 操作步骤: 注意事项: 异常处理:…
一.  Ansible 介绍Ansible是一个配置管理系统configuration management system, python 语言是运维人员必须会的语言, ansible 是一个基于python 开发的自动化运维工具, 其功能实现基于ssh远程连接服务, ansible 可以实现批量系统配置,批量软件部署,批量文件拷贝,批量运行命令等功能, 除了ansible之外,还有saltstack 等批量管理软件. Ansible能做什么? ansible可以帮助运维人员完成一些批量任务,或…
容器技术的发展可以分为两个阶段,第一个阶段聚焦在IaaS层,仅仅把容器当做更轻量级虚拟机来使用,解决了应用运行时进程级资源隔离的问题:随着Docker的出现,容器虚拟化才有了统一的平台,由此容器技术发展到了第二个阶段,开始聚焦在PaaS层,以应用为中心,统一应用分发标准,实现DevOps. 本篇将针对操作系统.主机配置.容器镜像.容器运行时四大方面分享一些Docker的运维经验. 操作系统 1.支持的操作系统类型 目前Docker官方支持的操作系统包含桌面版.服务器版.云提供商以及容器操作系统,…
回想起来,从事linux运维工作已近5年之久了,日常工作中会用到很多常规命令,之前简单罗列了一些命令:http://www.cnblogs.com/kevingrace/p/5985486.html今天在这里,详细总结下运维工作中常常用到的一些操作命令(依据本人使用经验而言): 文件系统结构和基本操作命令                                                                  chmod命令:改变权限 常用用法:chmod -R xxxx…
作为一名资深的linux运维工程师,为方便了解和追求服务器的高性能,如cpu.内存.io.网络等等使用情况,要求运维工程师必须要熟练运用一些必要的系统性能调试工具,liunx下提供了众多命令方便查看各种资源的使用情况.经常用的有ps.top.free.mpstat.iostat.vmstat.netstat..下面简单介绍下这几个工具的使用: 一.toptop是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器.top显示系统当前的进程和其…
熟练掌握Nginx负载均衡的使用对运维人员来说是极其重要的!下面针对Nignx负载均衡upstream容错机制的使用做一梳理性说明: 一.nginx的upstream容错 1)nginx 判断节点失效状态Nginx默认判断失败节点状态以connect refuse和time out状态为准,不以HTTP错误状态进行判断失败,因为HTTP只要能返回状态说明该节点还可以正常连接,所以nginx判断其还是存活状态:除非添加了proxy_next_upstream指令设置对404.502.503.504…
之前在公司机房部署了一套jenkins环境,现需要迁移至IDC机房服务器上,迁移过程中记录了一些细节:1)jenkins默认的主目录放在当前用户家目录路径下的.jenkins目录中.如jenkins使用root用户启动,则主目录为/root/.jenkins [root@code-server ~]# ll -d /root/.jenkins/ drwxr-x--- 14 root root 4096 Dec 18 15:22 /root/.jenkins/ 2)可以在系统环境变量里手动设置je…
一.ELK日志分析工具介绍1) Elasticsearch1.1)  Elasticsearch介绍ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是第二流行的企业搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便. 1.2)  Elasticsearch几个重要术语-  NRT elasti…
之前详细介绍了Ansible的安装, 配置, 以及Ansible常用模块的使用. 下面对Ansible的playbook用法做一小结. 为什么引入playbook?一般运维人员完成一个任务, 比如安装部署一个httpd服务会需要多个模块(一个模块也可以称之为task)提供功能来完成.而playbook就是组织多个task的容器,它的实质就是一个文件,有着特定的组织格式,它采用的语法格式是YAML(Yet Another Markup Language).YAML语法能够简单的表示散列表,字典等数…
第2部-重要目录结构详解 1.回顾Linux目录结构知识 /dev/            设备目录 /etc/             系统配置及服务配置文件,启动命令的目录 /proc            显示内核及进程信息的虚拟文件系统 /tmp             临时文件目录,公共厕所,客厅 /home          普通用户家目录,大臣的家 /root             超级管理员的家目录,皇宫 /var               变化的目录,一般是日志文件,cac…
在日常的运维工作中,经常会用到nginx服务,也时常会碰到nginx因高并发导致的性能瓶颈问题.今天这里简单梳理下nginx性能优化的配置(仅仅依据本人的实战经验而述,如有不妥,敬请指出~) 一.这里的优化主要是指对nginx的配置优化,一般来说nginx配置文件中对优化比较有作用的主要有以下几项:1)nginx进程数,建议按照cpu数目来指定,一般跟cpu核数相同或为它的倍数. worker_processes 8;2)为每个进程分配cpu,上例中将8个进程分配到8个cpu,当然可以写多个,或…
一.系统基础信息模块 1.1 系统性能信息模块psutil psutil是一个跨平台库(http://code.google.com/p/psutil/),能够轻松实现获取系统运行的进程和系统利用率(包括CPU.内存.磁盘.网络等)信息.它主要应用于系统监控,分析和限制系统资源及进程的管理.它实现了同等命令行工具提供的功能,如ps.top.lsof.netstat.ifconfig.who.df.kill.free.nice.ionice.iostat.iotop.uptime.pidof.tt…
第三部 3. Linux系统文件重要知识初步讲解 # ls  -lhi   (i: inode,每个文件前的数字代表文件身份ID:h: human 人类可读) 显示:25091 -rw-r--r-- 1 root root 81 4月 15 00:33 oldboy.txt 第1列:inode=>index node  索引节点编号. 第2列:文件类型及权限(共10个字符,第一个字符为类型,后9个字符为文件权限). 第3列:硬链接个数( 详细参看ln命令的讲解).硬链接是文件的又一个入口. 第4…