ceph-fuse客户端问题排查流程
本文讲述了ceph-fuse客户端问题排查基本流程:)
首先查看集群的整体情况
ceph -s
是否有osd挂掉,是否有pg非active
ceph-fuse进程是否存在?
ps -ef |grep ceph-fuse
ceph-fuse进程不存在
需查看日志看什么原因,log文件默认为 /var/log/ceph/ceph-client.${user_id}.log
ceph-fuse进程存在,但是访问卡
ceph-fuse客户端的unix socket文件为:
/var/run/ceph/ceph-client.${user_id}.asok
其中${user_id} 一般为admin,可以通过查看ceph-fuse进程获取,或通过查看ceph.conf获得
1. 检查下该客户端与mds的连接session是否正常:
ceph daemon /var/run/ceph/ceph-client.${user_id}.asok mds_sessions
如果mds session 的state不是open,通过netstat -anp 查看下客户端到mds的网络连接是否存在,状态是否正常,并根据情况决定是否往网络方向进行进一步检查
2. 访问卡住,说明客户端有正在进行中的请求,该请求可能是发往mds,也有可能是发往osd,通过如下命令查看:
- 查看客户端发往mds的请求:
ceph daemon /var/run/ceph/ceph-client.${id}.asok mds_requests
- 查看客户端发往osd的请求:
ceph daemon /var/run/ceph/ceph-client.${id}.asok objecter_requests
- 如果卡住的请求是发往mds的,去到active的mds上,查看mds收到的正在处理的请求:
ceph daemon /var/run/ceph/ceph-mds.${id}.asok ops
通过该命令可以查看卡住的op卡住哪个阶段,比如 [ initiated ]、[ failed to wrlock, waiting ]、[ failed to xlock, waiting ]等阶段
- 如果卡住的请求是发往osd的:
- 可以通过netstat -anp 来查看到客户端到osd的网络连接是否正常
- 登录到osd的机子,通过osd的unix socket来查看该osd正在处理的op:
ceph daemon /var/run/ceph/ceph-osd.${osd_id}.asok dump_ops_in_flight
通过该命令可以查看卡住的op卡住哪个阶段,可以通过iostat查看该osd的磁盘的ioutil是否高,来确定磁盘是否繁忙
关注笔者
专注笔者公众号,阅读更多干货文章:)

ceph-fuse客户端问题排查流程的更多相关文章
- “Ceph浅析”系列之五——Ceph的工作原理及流程
本文将对Ceph的工作原理和若干关键工作流程进行扼要介绍.如前所述,由于Ceph的功能实现本质上依托于RADOS,因而,此处的介绍事实上也是针对RADOS进行.对于上层的部分,特别是RADOS GW和 ...
- atitit.404错误的排查流程总结vOa6
atitit.404错误的排查流程总结vOa6 1. 场景 1 1.1. 子应用猛个腊擦不能使用 404 兰.. 1 2. 服务器配置问题 2 2.1. 登录服务器管理子应用,查看应用是否启动okk ...
- atitit.404错误的排查流程总结
atitit.404错误的排查流程总结 #----------jsp head errorPage="" del zeu ok le. #------resin 服务器配置问题 ...
- paip.hql的调试故障排查流程总结
paip.hql的调试故障排查流程总结 环境.myeclipse7.0 1 Hql的调试工具myeclipxe默认工具.../Hibernate8IDE 1 故障的排除方法overview 1 Hql ...
- Ceph的客户端丢失文件夹的解决办法
原来的解决办法 更新linux内核,使用linux内核级的mount方式,一段时间后将会在客户端看不到部分长期不使用的文件夹 更正后的解决办法 参考Ceph的客户端安装设置ceph-fuse方式挂载c ...
- coTurn 运行在Windows平台的方法及服务与客户端运行交互流程和原理
coTurn是一个开源的STUN和TURN及ICE服务项目,只是不支持Windows.为了在window平台上使用coTurn源码,需要在windows平台下安装Cygwin环境,并编译coTurn源 ...
- Atitit 404错误的排查流程总结 v3 qaf
Atitit 404错误的排查流程总结 v3 qaf 1.1. 用了注解不生效 提示404 Not Found1 1.2. 路径不对了,开头多了个空格1 2. 500 Servlet Excepti ...
- Ceph的工作原理及流程
本文将对Ceph的工作原理和若干关键工作流程进行扼要介绍.如前所述,由于Ceph的功能实现本质上依托于RADOS,因而,此处的介绍事实上也是针对RADOS进行.对于上层的部分,特别是RADOS GW和 ...
- atitit.流程标准化--- mysql启动不起来的排查流程attilax总结
atitit.流程标准化--- mysql启动不起来的排查流程attilax总结 1. mysql的启动日志文件 1 2. console方式 1 3. 安装为服务 1 3.1. 使用默认配置文件 1 ...
随机推荐
- CORSFilter
import java.io.IOException; import javax.servlet.Filter;import javax.servlet.FilterChain;import java ...
- Template简介
分类 ControlTemplate ItemsPanelTemplate DataTemplate 样式Style和模板Template对比 Style:样式,风格Template:模版,某种控 ...
- RestSharp 封状实例
1 public class Rest<T> { private static Logger logger = LogManager.GetCurrentClassLogger(); pr ...
- layabox pc app web同步发布的工具
http://layabox.com/ 或者vs + unity3d开发游戏
- C#连接oracle 数据库查询时输入中文查询不出来,用plsql就可以
查询语句为:select * from Per where khmc like '%李%',其实是字符集的问题. 解决方案:在连接字符串加一个“Unicode=True;”
- 算法之--回溯法-迷宫问题【python实现】
题目描述 定义一个二维数组N*M(其中2<=N<=10;2<=M<=10),如5 × 5数组下所示: int maze[5][5] = { 0, 1, 0, 0, 0, 0, ...
- Java 线程池(一):开篇及Executor整体框架介绍
一.开篇 线程池.数据库连接池,在平时的学习中总能接触到这两个词,但它们到底是什么?和线程,数据库连接有什么关系?为什么需要“池”?“池”的概念及作用是什么?要弄清楚这些问题,就要深入到“池”的实现中 ...
- 让您的应用兼容 Android Oreo
不知不觉Android Oreo已经发布几个月时间了,你的应用开始使用最新平台了吗?在应用迁移过程中是否遇到了一些棘手问题?你的Android应用兼容Oreo如何呢? 我们应该都知道,每一次重大升级, ...
- Elasticsearch教程(一)简介与安装
简单概念 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticsearch是用Java开发的,并作为 ...
- 核心思想:自由职业的所谓自由,必须先职业,然后才能自由(还要对抗自己的惰性,提前寻找客户)good
除了前面提到的专业性,还要足够自律,能够管理好自己的时间和精力. 具体来说,需要目标管理和时间(精力)管理. 所谓目标管理,对于自由职业者来讲,就是要识别出自己最擅长的方向,确立自己可以提供的最有价值 ...