利用xlrd模块读取excel利用json模块生成相应的json文件的脚本
excel的格式如下
python代码如下,这里最难的就是合并单元格的处理
- import xlrd
- import json
- excel_obj = xlrd.open_workbook("test.xlsx")
- sheet_name = excel_obj.sheet_names()[0]
- sheet_obj = excel_obj.sheet_by_index(0)
- hadoop_dict = {
- "services": [
- "AMBARI_METRICS",
- "HBASE",
- "HDFS",
- "HIVE",
- "KAFKA",
- "MAPREDUCE2",
- "PIG",
- "SLIDER",
- "SMARTSENSE",
- "SPARK2",
- "STORM",
- "TEZ",
- "YARN",
- "ZOOKEEPER"
- ],
- "pm_group" :[],
- "host_groups":[]
- }
- host = {}
- vm = {}
- # components_list = []
- r_num = sheet_obj.nrows
- c_num = sheet_obj.ncols
- merge_cell_list = sheet_obj.merged_cells
- # for i in range(r_num):
- # if sheet_obj.cell_value(i,c_num-1):
- # components_list.append(sheet_obj.cell_value(i,c_num-1))
- # 获取最后一列的所有数据
- for i in merge_cell_list:
- if i[2] == 0:
- host[sheet_obj.cell_value(i[0],i[2])] = [i[0],i[1],i[2],i[3]]
- # 存放所有合并的单元格
- for k,v in host.items():
- host_dict = {}
- print(sheet_obj.cell_value(v[0],1),sheet_obj.cell_value(v[0],2),sep="---->")
- # 获取主机的ip地址
- pm_ip = sheet_obj.cell_value(v[0],2)
- print(pm_ip,"物理机地址")
- print(sheet_obj.cell_value(v[0] + 1,1),sheet_obj.cell_value(v[0] + 1,2),sep="---->")
- # 获取主机的主机名
- pm_name = sheet_obj.cell_value(v[0] + 1,2)
- host_dict["ip"] = pm_ip
- host_dict["hostname"] = pm_name
- host_dict["vms"] = []
- for vms_cell in merge_cell_list:
- vm_dict = {}
- vm_components_dict = {}
- if vms_cell[1] <= host[k][1] and vms_cell[2] == 2 and vms_cell[0] > host[k][0] + 1:
- print(sheet_obj.cell_value(vms_cell[0],2))
- # 获取虚拟机的名称
- print(sheet_obj.cell_value(vms_cell[0],vms_cell[2] + 1))
- # 获取虚拟机的ip的k
- print(sheet_obj.cell_value(vms_cell[0],vms_cell[2] + 2))
- # 获取虚拟机的ip地址
- vm_ip = sheet_obj.cell_value(vms_cell[0], vms_cell[2] + 2)
- print(sheet_obj.cell_value(vms_cell[0] + 1, vms_cell[2] + 1))
- # 获取虚拟机的虚拟机名称的k
- print(sheet_obj.cell_value(vms_cell[0] + 1, vms_cell[2] + 2))
- # 获取虚拟机的名字的值
- vm_name = sheet_obj.cell_value(vms_cell[0] + 1, vms_cell[2] + 2)
- vm_name = sheet_obj.cell_value(vms_cell[0] + 1, vms_cell[2] + 2)
- vm_dict = {
- "hostname":vm_name,
- }
- vm_components_dict["ip"] = vm_ip
- vm_components_dict["hostname"] = vm_name
- vm_components_dict["components"] = []
- host_dict["vms"].append(vm_dict)
- vmcomponents_location_start = vms_cell[0] + 2
- vmcomponents_location_end = vms_cell[1]
- # print(vmcomponents_location_start,vmcomponents_location_end,"我是大傻逼")
- vm_components_info_list = []
- for i in range(vmcomponents_location_start,vmcomponents_location_end):
- temp_components = sheet_obj.cell_value(i,c_num-1)
- vm_components_info_list.append(temp_components)
- for component in vm_components_info_list:
- temp_dict = {}
- temp_dict["name"] = component
- vm_components_dict["components"].append(temp_dict)
- hadoop_dict["host_groups"].append(vm_components_dict)
- # 获取每个虚拟机的components信息
- hadoop_dict["pm_group"].append(host_dict)
- import json
- file_name = "journalnode_".upper() + "test_journalnode_case_1" + "." + "json"
- my_file_obj = open(file_name,"w")
- json.dump(hadoop_dict,my_file_obj,indent=4)
- my_file_obj.close()
最后按照要求生成制定格式的json文件
- {
- "services": [
- "AMBARI_METRICS",
- "HBASE",
- "HDFS",
- "HIVE",
- "KAFKA",
- "MAPREDUCE2",
- "PIG",
- "SLIDER",
- "SMARTSENSE",
- "SPARK2",
- "STORM",
- "TEZ",
- "YARN",
- "ZOOKEEPER"
- ],
- "pm_group": [
- {
- "ip": "1.1.1.1",
- "hostname": "host1",
- "vms": [
- {
- "hostname": "vm1"
- },
- {
- "hostname": "vm2"
- },
- {
- "hostname": "vm3"
- }
- ]
- },
- {
- "ip": "1.1.1.2",
- "hostname": "host2",
- "vms": [
- {
- "hostname": "vm4"
- },
- {
- "hostname": "vm5"
- }
- ]
- },
- {
- "ip": "1.1.1.3",
- "hostname": "host3",
- "vms": [
- {
- "hostname": "vm6"
- }
- ]
- }
- ],
- "host_groups": [
- {
- "ip": "192.168.1.1",
- "hostname": "vm1",
- "components": [
- {
- "name": "ZOOKEEPER_SERVER"
- },
- {
- "name": "JOURNALNODE"
- },
- {
- "name": "NODEMANAGER"
- }
- ]
- },
- {
- "ip": "192.168.1.2",
- "hostname": "vm2",
- "components": [
- {
- "name": "HBASE_REGIONSERVER"
- },
- {
- "name": "ZKFC"
- }
- ]
- },
- {
- "ip": "192.168.1.3",
- "hostname": "vm3",
- "components": [
- {
- "name": "HBASE_CLIENT"
- }
- ]
- },
- {
- "ip": "192.168.1.4",
- "hostname": "vm4",
- "components": [
- {
- "name": "ZOOKEEPER_SERVER"
- },
- {
- "name": "JOURNALNODE"
- },
- {
- "name": "NODEMANAGER"
- }
- ]
- },
- {
- "ip": "192.168.1.5",
- "hostname": "vm5",
- "components": [
- {
- "name": "HBASE_REGIONSERVER"
- },
- {
- "name": "ZKFC"
- }
- ]
- },
- {
- "ip": "192.168.1.6",
- "hostname": "vm6",
- "components": [
- {
- "name": "ZOOKEEPER_SERVER"
- },
- {
- "name": "JOURNALNODE"
- },
- {
- "name": "NODEMANAGER"
- }
- ]
- }
- ]
- }
利用xlrd模块读取excel利用json模块生成相应的json文件的脚本的更多相关文章
- 利用 pandas库读取excel表格数据
利用 pandas库读取excel表格数据 初入IT行业,愿与大家一起学习,共同进步,有问题请指出!! 还在为数据读取而头疼呢,请看下方简洁介绍: 数据来源为国家统计局网站下载: 具体方法 代码: i ...
- Python xlrd模块读取Excel表中的数据
1.xlrd库的安装 直接使用pip工具进行安装(当然也可以使用pycharmIDE进行安装,这里就不详述了) pip install xlrd 2.xlrd模块的一些常用命令 ①打开excel文件并 ...
- Xlrd模块读取Excel文件数据
Xlrd模块使用 excel文件样例:
- Python-用xlrd模块读取excel,数字都是浮点型,日期格式是数字的解决办法
excel文件内容: 读取excel: # coding=utf-8 import xlrd import sys reload(sys) sys.setdefaultencoding('utf-8' ...
- 猜想-未做 利用office组件读取excel数据
---未实际使用过 用SQL-Server访问Office的Access和Excel http://blog.sina.com.cn/s/blog_964237ea0101532x.html 2007 ...
- python 利用三方的xlrd模块读取excel文件,处理合并单元格
目的: python能使用xlrd模块实现对Excel数据的读取,且按照想要的输出形式. 总体思路: (1)要想实现对Excel数据的读取,需要用到第三方应用,直接应用. (2)实际操作时候和我 ...
- 后端Nodejs利用node-xlsx模块读取excel
后端Nodejs(利用node-xlsx模块) /** * Created by zh on 16-9-14. */ var xlsx = require("node-xlsx") ...
- 基础补充:使用xlrd模块读取excel文件
因为接口测试用例使用excel文件来维护的,所以有必要学习下操作excel的基本方法 参考博客:python 3 操作 excel 把自己练习的代码贴出来,是一些基本的操作,每行代码后面都加了注释. ...
- python-利用xlrd模块读取excel数据,将excel数据转换成字典格式
前言 excel测试案例数据 转换成这种格式 实现代码 import os import xlrd excel_path = '..\data\\test_case.xlsx' data_path = ...
随机推荐
- django--用户认证组件
用户认证组件 用户认证组件: 功能:用session记录登录验证状态 前提:用户表:django自带的auth_user 创建超级用户: python3 manage.py createsuperus ...
- 十张GIFs让你弄懂递归等概念
图像(包括动图)是传递信息的一种高效方式,往往能增强表象.记忆与思维等方面的反应强度.所谓一图胜千言,说的就是这个道理. 今天为大家整理了十张动图GIFS,有助于认识循环.递归.二分检索等概念的具体运 ...
- Linux下tomcat运行命令
tomcat启动 [root@master webapps]# /usr/local/tomcat7.0/bin/catalina.sh start startup.sh的源代码,其实就是执行 c ...
- linux 自定义模块来缓存skb的意义
linux中,管理网卡收发报文的结构是sk_buff,这个结构比freebsd中的m_buf复杂的多,这个也是为什么现在用户态协议栈大多采用bsd为基础来实现的一个原因. struct sk_buff ...
- Oracle数据库中的数据出错的解决办法
http://www.jcwcn.com/article/database/oracle/ 今天上班犯了一个严重的错误:把我们系统所使用的Oracle数据库中的数据给改掉了!当发现自己改错时,顿时冒了 ...
- ie11 调试工具不能使用
使用ie11仿真ie8测试兼容性的时候,方便调试 dom和仿真都不能用 搜索 https://www.ludou.org/win7-ie-11-f12-bug.html也有相关问题 安装补丁 64位的 ...
- Nmap结果文件XML文件解析
对nmap扫描结果xml格式的文件进行解析,无需直接xml解析或读取,可直接使用模块: 1.nmapparser 安装:pip install nmapparser Demo: #!/usr/bin/ ...
- c++之enum的好处与 define 的区别
转载自 https://blog.csdn.net/zhh464626057/article/details/41038933 什么时候需要用到enum呢?就是变量的数值在几个范围之间.red,blu ...
- JDK8中JVM堆内存划分
一:JVM中内存 JVM中内存通常划分为两个部分,分别为堆内存与栈内存,栈内存主要用运行线程方法 存放本地暂时变量与线程中方法运行时候须要的引用对象地址. JVM全部的对象信息都 存放在堆内存中.相比 ...
- JUC(java.util.concurrent)
在 Java 5.0 提供了 java.util.concurrent (简称JUC )包,在此包中增加了在并发编程中很常用的实用工具类,用于定义类似于线程的自定义子系统,包括线程池.异步 IO 和轻 ...