（新手)使用pandas操作EXCEL

import pandas as pd
import numpy as np
from pandas import DataFrame,Series
#path = r'C:\Users\tsl\Desktop\数据.xlsx'
#一列数据前面添加字符串
def add_C(village_data):
    village_data['电话'] = ['C%s' % y for y in village_data['电话']]
    return village_data['电话']
#读取excel
data = pd.read_excel(r'C:\Users\tsl\Desktop\数据.xlsx')
#判定某列中是否有null,如果有删除null 行
if data['电话'].isnull().any():
#将excel里面空值修改
    data['电话'] = data['电话'].fillna('999')
#得到999值的索引室号
    data_index = data[data.电话=='999'].index.tolist()
#删除
    data = data.drop(data_index)
#以街道分组
group_by_name = data.groupby('街道')
#需要groups得出具体结果
for i in group_by_name.groups:
    village_data = data.loc[data['街道'] == i ]
    add_C(village_data)
　　#以楼栋分组
    group_by_name_build = village_data.groupby('楼栋')
    for build_name in group_by_name_build.groups:
        build_data = village_data.loc[village_data['楼栋'] == build_name]
        build_data = build_data.drop_duplicates(subset='室号', keep='first')
　　　　　　#更改列的数据类型
        build_data['室号'] = build_data['室号'].astype(np.str)
        row_index = 0
        for house_num in build_data['室号']:
            if '-' in house_num:
                house_num = house_num.replace('-','9') #并没有修改原内存地址的值，固需要赋值给原有内存地址
            #选区某行某列并赋值
                build_data.iat[row_index,2] = house_num
            row_index +=1
        del build_data['街道']
        del build_data['楼栋']
        #修改列名
        build_data.columns = ['用户编码','指定开门','电话号码']
        build_data['指定开门'] = '双门'
        build_data_row_index = 0
        for modify_num in build_data['用户编码']:
            if len(modify_num) < 4:
                modify_num = '0' + modify_num   #并没有修改原内存地址的值，固需要赋值给原有内存地址
                build_data.iat[build_data_row_index,0] = modify_num
            build_data_row_index +=1
#保存/生成新的excle
        DataFrame(build_data).to_excel('C:\\Users\\tsl\Desktop\info\%s.xls' % (build_name),sheet_name='Sheet1',index=False,header=True )

##优化后

import pandas as pd
import numpy as np
from pandas import DataFrame,Series
#读取excel
#path = r'C:\Users\tsl\Desktop\数据.xlsx'
def Build_data(build_data):
    #一个有索引和行内容的迭代器
    for data_line_index,data_line in build_data.iterrows():
            if '-' in data_line['用户编码']:
                data_line['用户编码'] = data_line['用户编码'].replace('-','9')
                # house_num = house
            if len(data_line['用户编码'])<4:
                data_line['用户编码'] = '0'+ data_line['用户编码']
            data_line['电话号码'] = data_line['电话号码'][:-2]
    return build_data
def add_C(village_data):
    village_data['电话'] = ['C%s' % y for y in village_data['电话']]
    return village_data['电话']
data = pd.read_excel(r'C:\Users\tsl\Desktop\数据.xlsx')
data_index = 0
#判定列中是否有null,如果有删除null 行
if data['电话'].isnull().any():
#将excel里面空值修改
    data['电话'] = data['电话'].fillna('999')
#得到999值的索引室号
    data_index_1 = data[data.电话=='999'].index.tolist()
#删除
    data = data.drop(data_index_1)
#已街道分组
group_by_name = data.groupby('街道')
#需要groups得出具体结果
for i in group_by_name.groups:
    village_data = data.loc[data['街道'] == i ]
    add_C(village_data)
    group_by_name_build = village_data.groupby('楼栋')
    for build_name in group_by_name_build.groups:
        build_data = village_data.loc[village_data['楼栋'] == build_name]
        build_data = build_data.drop_duplicates(subset='室号', keep='first')
        del build_data['街道']
        del build_data['楼栋']
        #修改列名
        build_data.columns = ['用户编码','指定开门','电话号码']
        build_data['指定开门'] = '双门'
        build_data  = build_data.astype(np.str)
        build_data = Build_data(build_data)
        DataFrame(build_data).to_excel('C:\\Users\\tsl\Desktop\info\%s.xls' % (build_name),sheet_name='Sheet1',index=False,header=True )

（新手)使用pandas操作EXCEL的更多相关文章

Python Pandas操作Excel
Python Pandas操作Excel 前情提要 ☟ 本章使用的 Python3.6 Pandas==0.25.3 项目中需要用到excel的文件字段太多考虑到后续字段命名的变动以及中文/英文/日 ...
Python openpyxl、pandas操作Excel方法简介与具体实例
本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据 ...
Pandas操作excel
读取excel:Pandas库read_excel()参数详解 pandas.read_excel(io,sheet_name = 0,header = 0,names = None,index_co ...
【Python自动化Excel】pandas操作Excel的“分分合合”
话说Excel数据表,分久必合.合久必分.Excel数据表的"分"与"合"是日常办公中常见的操作.手动操作并不困难,但数据量大了之后,重复性操作往往会令人崩溃. ...
pandas 操作 excel
1. 多重 sheet Using Pandas to pd.read_excel() for multiple worksheets of the same workbook pd.read_exc ...
Python利用pandas处理Excel数据的应用
Python利用pandas处理Excel数据的应用最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在做 ...
【python基础】利用pandas处理Excel数据
参考:https://www.cnblogs.com/liulinghua90/p/9935642.html 一.安装第三方库xlrd和pandas 1:pandas依赖处理Excel的xlrd模块, ...
用Python的pandas框架操作Excel文件中的数据教程
用Python的pandas框架操作Excel文件中的数据教程本文的目的,是向您展示如何使用pandas 来执行一些常见的Excel任务.有些例子比较琐碎,但我觉得展示这些简单的东西与那些你可以在其 ...
pandas神器操作excel表格大全（数据分析数据预处理）
使用pandas库操作excel,csv表格操作大全关注公众号"轻松学编程"了解更多,文末有公众号二维码,可以扫码关注哦. 前言准备三份csv表格做演示: 成绩表.csv su ...

随机推荐

[WPF自定义控件库]简单的表单布局控件
1. WPF布局一个表单 <Grid Width="400" HorizontalAlignment="Center" VerticalAlignment ...
HDU 5496——Beauty of Sequence——————【考虑局部】
Beauty of Sequence Time Limit: 6000/3000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Other ...
Emgu CV 初试
Emgu CV 是.NET平台下对OpenCV图像处理库的封装,也就是.NET版.可以运行在C#.VB.VC++等. 安装完成后需要设置环境变量,比如我安装在D:\Emgu\emgucv-window ...
Java爬虫初体验
年关将近,工作上该完成的都差不多了,上午闲着就接触学习了一下爬虫,抽空还把正则表达式复习了,Java的Regex和JS上还是有区别的,JS上的"\w"Java得写成"\\ ...
hibernate课程初探单表映射3-4 组件属性
本节内容: 1 简介组件属性 2 demo 1 简介组件属性: <component name = "address" class = "Address" ...
Day5 CSS基本样式和C3选择器
Day5 CSS基本样式和C3选择器一.背景属性 1.背景颜色 background-color:transparent(默认值,透明); 颜色的取值: ...
Git 常用基本命令汇总
安装git yum install -y curl-devel expat-devel gettext-devel openssl-devel zlib-devel yum install -y gi ...
SpringBoot的特性
SpringBoot的理念“习惯优于配置” 习惯优于配置(项目中存在大量的配置,此外还内置了一个习惯性的配置,无须手动进行配置) 使用SpringBoot可以方便地创建独立运行.准生产级别的基于Spr ...
SQL优化 · 经典案例 · 索引篇
Introduction 在这些年的工作之中,由于SQL问题导致的数据库故障层出不穷,下面将过去六年工作中遇到的SQL问题总结归类,还原问题原貌,给出分析问题思路和解决问题的方法,帮助用户在使用数据库 ...
Java 中 Double 相关问题
在项目当中,对于double类型数据的使用比较频繁.尤其是处理金钱相关的数据,在使用Double类型的数据时,涉及到精度,显示,四舍五入等等问题. 1. 显示问题,当double 数据小于 0.0 ...

（新手)使用pandas操作EXCEL

（新手)使用pandas操作EXCEL的更多相关文章

随机推荐

热门专题