pandas操作excle

Python是一门强大的编程语言，也是数据科学领域中最流行的语言之一。在处理数据时，很多时候需要与Excel进行交互，以进行数据读取、清理和分析。Python中有很多工具可以与Excel进行交互，其中pandas是其中最受欢迎的库之一。在本文中，我们将介绍如何使用Python和pandas进行Excel文件操作，并讨论一些常用的pandas方法。

读取Excel文件：

import pandas as pd

df = pd.read_excel('example.xlsx')

读取指定的Excel表单：

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

写入数据到Excel文件：

df.to_excel('example.xlsx', sheet_name='Sheet1', index=False)

追加数据到Excel文件：

with pd.ExcelWriter('example.xlsx', mode='a') as writer:

    df.to_excel(writer, sheet_name='Sheet1', index=False)

选择Excel表单中的列：

df = pd.read_excel('example.xlsx')

selected_cols = ['col1', 'col2']

df_selected = df[selected_cols]

选择Excel表单中的行：

df = pd.read_excel('example.xlsx')

selected_rows = df.loc[df['col1'] == 'value1']

过滤Excel表单中的行：

df = pd.read_excel('example.xlsx')

filtered_rows = df[df['col1'].str.contains('value')]

按列排序：

df = pd.read_excel('example.xlsx')

sorted_df = df.sort_values(by='col1')

按列分组并求和：

df = pd.read_excel('example.xlsx')

grouped_df = df.groupby('col1').sum()

对Excel表单中的列应用函数：

df = pd.read_excel('example.xlsx')

df['new_col'] = df['col1'].apply(lambda x: x * 2)

使用Pivot表：

df = pd.read_excel('example.xlsx')

pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

插入新的行：

df = pd.read_excel('example.xlsx')

new_row = pd.DataFrame({'col1': 'value1', 'col2': 'value2'}, index=[0])

df = pd.concat([new_row, df]).reset_index(drop=True)

插入新的列：

df = pd.read_excel('example.xlsx')

new_col = pd.Series(['value1', 'value2'])

df['new_col'] = new_col

删除行：

df = pd.read_excel('example.xlsx')

df = df.drop(df[df['col1'] == 'value1'].index)

删除列：

df = pd.read_excel('example.xlsx')

df = df.drop('col1', axis=1)

重命名列：

df = pd.read_excel('example.xlsx')

df = df.rename(columns={'col1': 'new_col1', 'col2': 'new_col2'})

修改单元格的值：

df = pd.read_excel('example.xlsx')

df.loc[df['col1'] == 'value1', 'col2'] = 'new_value'

使用多重索引：

df = pd.read_excel('example.xlsx')

df = df.set_index(['col1', 'col2'])

读取多个Excel文件并合并：

import os

path = 'path/to/files'

all_files = os.listdir(path)

all_excels = [file for file in all_files if file.endswith('.xlsx')]

dfs = [pd.read_excel(os.path.join(path, file)) for file in all_excels]

merged_df = pd.concat(dfs)

选择特定的单元格：

df = pd.read_excel('example.xlsx')

cell_value = df.at[0, 'col1']

拆分Excel表单中的列：

df = pd.read_excel('example.xlsx')

split_cols = df['col1'].str.split('-', expand=True)

split_cols.columns = ['col1_part1', 'col1_part2']

将Excel表单中的列合并：

df = pd.read_excel('example.xlsx')

df['col1'] = df['col1'].astype(str) + '-' + df['col2'].astype(str)

将Excel表单中的日期列格式化：

df = pd.read_excel('example.xlsx')

df['date_col'] = pd.to_datetime(df['date_col'], format='%Y-%m-%d')

根据Excel表单中的某一列填充空值：

df = pd.read_excel('example.xlsx')

df['col1'] = df['col1'].fillna(method='ffill')

根据Excel表单中的某一列去除重复行：

df = pd.read_excel('example.xlsx')

df = df.drop_duplicates(subset='col1')

将Excel表单中的数字列格式化为百分比：

df = pd.read_excel('example.xlsx'

df['percentage_col'] = df['percentage_col'].apply(lambda x: '{:.2%}'.format(x))

将Excel表单中的数字列四舍五入：

df = pd.read_excel('example.xlsx')

df['decimal_col'] = df['decimal_col'].round(2)

根据Excel表单中的某一列进行透视：

df = pd.read_excel('example.xlsx')

pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

计算Excel表单中列的总数：

df = pd.read_excel('example.xlsx')

col_total = df['col1'].sum()

统计Excel表单中每个值的数量：

df = pd.read_excel('example.xlsx')

value_counts = df['col1'].value_counts()

pandas操作excle的更多相关文章

pandas操作行集锦
pandas移花接木数据准备两表: 我们接下来要进行的操作: 增将两表进行合并 # 把两张表合并,但是这样有问题,索引会重复的进行0-19 students = page_001.append(p ...
pandas操作，感觉不错，复制过来的
整理pandas操作本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filenam ...
Python之Pandas操作csv文件dataframe
# -*- coding: utf-8 -*- # author:baoshan import pandas as pd def main(): aqi_data = pd.read_csv('chi ...
python 操作excle 之第三方库 openpyxl学习
目录 python 操作excle 之第三方库 openpyxl学习安装 pip install openpyxl 英文文档链接 : 点击这里~ 1,定位excel 2,读取excle中的内容 3, ...
Java操作Excle（基于Poi）
有一次有个同事问我会不会有java操作Excle,回答当然是不会了!感觉被嘲讽了,于是开始寻找度娘,找到个小例子,结果越写越有意思,最后就成就了这个工具类. import java.io.Buffer ...
Python Pandas操作Excel
Python Pandas操作Excel 前情提要 ☟ 本章使用的 Python3.6 Pandas==0.25.3 项目中需要用到excel的文件字段太多考虑到后续字段命名的变动以及中文/英文/日 ...
Pandas 操作
一.Series的创建: pd.Series([ 数据 ]) In [17]: import pandas as pd In [18]: import numpy as np In [19]: s = ...
整理pandas操作
本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filename):从CSV文件导入 ...
pandas操作
python中使用了pandas的一些操作,特此记录下来: 生成DataFrame import pandas as pd data = pd.DataFrame({ 'v_id': ["v ...
Python openpyxl、pandas操作Excel方法简介与具体实例
本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据 ...

随机推荐

C语言初级阶段4——数组2————二维数组
C语言初级阶段4--数组2----二维数组二维数组的定义:类型说明符数组名[数组大小] [数组大小] 第一个大小是行的大小,第二个大小是列的大小. 二维数组的初始化:{} #include< ...
04 Hadoop思想与原理
Hadoop最早起源于Nutch.Nutch的设计目标是构建一个大型的全网搜索引擎,包括网页抓取.索引.查询等功能,但随着抓取网页数量的增加,遇到了严重的可扩展性问题--如何解决数十亿网页的存储和索引 ...
Jmeter 接口自动化对变量【登录密码】进行加密处理
在我们使用Jmeter测试的过程中,尤其是接口测试,有时候需要对参数进行MD5加密后再进行操作: Jmeter自带的就有MD5加密需要使用的到的jar(注意jmeter版本):commons-code ...
ABP vNext微服务架构详细教程——简介
概述该系列文章主要展示ABP vNext框架在微服务架构下的用法,提供一套可落地的技术实现思路,并演示各服务在Kubernetes下的部署方案. 基础概念 ABP vNext:基于ASP.NET C ...
ssh原理及应用
SSH原理与运用(一):远程登录 SSH原理与运用(一):远程登录 SSH原理与运用(二):远程操作与端口转发 SSH原理与运用(二):远程操作与端口转发 mitm应用: python开源三方库:ss ...
微信公众号授权登录，整合spring security
公司的业务需求,对接了微信公众号授权,通过微信公众号的接口拿到用户信息进行业务系统的登录,话不多说上代码,我的实现方式是整合了spingSecurity 首先是接口 @PostMapping(&quo ...
mysql5.7_win64位安装
1.下载MySQL压缩包解压缩 2.更改my.ini配置文件 [mysqld] #设置3306端口号 port=3306 #设置MySQL的安装目录 basedir=F:\\JavaSoftware\ ...
修改/编辑jar包
替换或者导入jar包时,jar包被自动压缩,springboot规定嵌套的jar包不能在被压缩的情况下存储. 解决(本文以升级ojdbc包为例): 使用jar命令解压jar包,在压缩包外重新替换jar ...
浅谈js防抖和节流
防抖和节流是处理高频触发最常见的优化方式,对性能提升有很大的帮助. 防抖:将多次的高频操作优化为只在最后一次执行,应用场景如:输入框,只需在最后一次输入进行校验即可. 节流:保证每隔一段时间只执行一次 ...
基于声网 Flutter SDK 实现互动直播
前言互动直播是实现很多热门场景的基础,例如直播带货.秀场直播,还有类似抖音的直播 PK等.本文是由声网社区的开发者"小猿"撰写的Flutter基础教程系列中的第二篇,他将带着大家 ...

pandas操作excle

读取Excel文件：

读取指定的Excel表单：

写入数据到Excel文件：

追加数据到Excel文件：

选择Excel表单中的列：

选择Excel表单中的行：

过滤Excel表单中的行：

按列排序：

按列分组并求和：

对Excel表单中的列应用函数：

使用Pivot表：

插入新的行：

插入新的列：

删除行：

删除列：

重命名列：

修改单元格的值：

使用多重索引：

读取多个Excel文件并合并：

选择特定的单元格：

拆分Excel表单中的列：

将Excel表单中的列合并：

将Excel表单中的日期列格式化：

根据Excel表单中的某一列填充空值：

根据Excel表单中的某一列去除重复行：

将Excel表单中的数字列格式化为百分比：

将Excel表单中的数字列四舍五入：

根据Excel表单中的某一列进行透视：

计算Excel表单中列的总数：

统计Excel表单中每个值的数量：

pandas操作excle的更多相关文章

随机推荐

热门专题