pandas操作excle

Python是一门强大的编程语言，也是数据科学领域中最流行的语言之一。在处理数据时，很多时候需要与Excel进行交互，以进行数据读取、清理和分析。Python中有很多工具可以与Excel进行交互，其中pandas是其中最受欢迎的库之一。在本文中，我们将介绍如何使用Python和pandas进行Excel文件操作，并讨论一些常用的pandas方法。

读取Excel文件：

import pandas as pd

df = pd.read_excel('example.xlsx')

读取指定的Excel表单：

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

写入数据到Excel文件：

df.to_excel('example.xlsx', sheet_name='Sheet1', index=False)

追加数据到Excel文件：

with pd.ExcelWriter('example.xlsx', mode='a') as writer:

    df.to_excel(writer, sheet_name='Sheet1', index=False)

选择Excel表单中的列：

df = pd.read_excel('example.xlsx')

selected_cols = ['col1', 'col2']

df_selected = df[selected_cols]

选择Excel表单中的行：

df = pd.read_excel('example.xlsx')

selected_rows = df.loc[df['col1'] == 'value1']

过滤Excel表单中的行：

df = pd.read_excel('example.xlsx')

filtered_rows = df[df['col1'].str.contains('value')]

按列排序：

df = pd.read_excel('example.xlsx')

sorted_df = df.sort_values(by='col1')

按列分组并求和：

df = pd.read_excel('example.xlsx')

grouped_df = df.groupby('col1').sum()

对Excel表单中的列应用函数：

df = pd.read_excel('example.xlsx')

df['new_col'] = df['col1'].apply(lambda x: x * 2)

使用Pivot表：

df = pd.read_excel('example.xlsx')

pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

插入新的行：

df = pd.read_excel('example.xlsx')

new_row = pd.DataFrame({'col1': 'value1', 'col2': 'value2'}, index=[0])

df = pd.concat([new_row, df]).reset_index(drop=True)

插入新的列：

df = pd.read_excel('example.xlsx')

new_col = pd.Series(['value1', 'value2'])

df['new_col'] = new_col

删除行：

df = pd.read_excel('example.xlsx')

df = df.drop(df[df['col1'] == 'value1'].index)

删除列：

df = pd.read_excel('example.xlsx')

df = df.drop('col1', axis=1)

重命名列：

df = pd.read_excel('example.xlsx')

df = df.rename(columns={'col1': 'new_col1', 'col2': 'new_col2'})

修改单元格的值：

df = pd.read_excel('example.xlsx')

df.loc[df['col1'] == 'value1', 'col2'] = 'new_value'

使用多重索引：

df = pd.read_excel('example.xlsx')

df = df.set_index(['col1', 'col2'])

读取多个Excel文件并合并：

import os

path = 'path/to/files'

all_files = os.listdir(path)

all_excels = [file for file in all_files if file.endswith('.xlsx')]

dfs = [pd.read_excel(os.path.join(path, file)) for file in all_excels]

merged_df = pd.concat(dfs)

选择特定的单元格：

df = pd.read_excel('example.xlsx')

cell_value = df.at[0, 'col1']

拆分Excel表单中的列：

df = pd.read_excel('example.xlsx')

split_cols = df['col1'].str.split('-', expand=True)

split_cols.columns = ['col1_part1', 'col1_part2']

将Excel表单中的列合并：

df = pd.read_excel('example.xlsx')

df['col1'] = df['col1'].astype(str) + '-' + df['col2'].astype(str)

将Excel表单中的日期列格式化：

df = pd.read_excel('example.xlsx')

df['date_col'] = pd.to_datetime(df['date_col'], format='%Y-%m-%d')

根据Excel表单中的某一列填充空值：

df = pd.read_excel('example.xlsx')

df['col1'] = df['col1'].fillna(method='ffill')

根据Excel表单中的某一列去除重复行：

df = pd.read_excel('example.xlsx')

df = df.drop_duplicates(subset='col1')

将Excel表单中的数字列格式化为百分比：

df = pd.read_excel('example.xlsx'

df['percentage_col'] = df['percentage_col'].apply(lambda x: '{:.2%}'.format(x))

将Excel表单中的数字列四舍五入：

df = pd.read_excel('example.xlsx')

df['decimal_col'] = df['decimal_col'].round(2)

根据Excel表单中的某一列进行透视：

df = pd.read_excel('example.xlsx')

pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

计算Excel表单中列的总数：

df = pd.read_excel('example.xlsx')

col_total = df['col1'].sum()

统计Excel表单中每个值的数量：

df = pd.read_excel('example.xlsx')

value_counts = df['col1'].value_counts()

pandas操作excle的更多相关文章

pandas操作行集锦
pandas移花接木数据准备两表: 我们接下来要进行的操作: 增将两表进行合并 # 把两张表合并,但是这样有问题,索引会重复的进行0-19 students = page_001.append(p ...
pandas操作，感觉不错，复制过来的
整理pandas操作本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filenam ...
Python之Pandas操作csv文件dataframe
# -*- coding: utf-8 -*- # author:baoshan import pandas as pd def main(): aqi_data = pd.read_csv('chi ...
python 操作excle 之第三方库 openpyxl学习
目录 python 操作excle 之第三方库 openpyxl学习安装 pip install openpyxl 英文文档链接 : 点击这里~ 1,定位excel 2,读取excle中的内容 3, ...
Java操作Excle（基于Poi）
有一次有个同事问我会不会有java操作Excle,回答当然是不会了!感觉被嘲讽了,于是开始寻找度娘,找到个小例子,结果越写越有意思,最后就成就了这个工具类. import java.io.Buffer ...
Python Pandas操作Excel
Python Pandas操作Excel 前情提要 ☟ 本章使用的 Python3.6 Pandas==0.25.3 项目中需要用到excel的文件字段太多考虑到后续字段命名的变动以及中文/英文/日 ...
Pandas 操作
一.Series的创建: pd.Series([ 数据 ]) In [17]: import pandas as pd In [18]: import numpy as np In [19]: s = ...
整理pandas操作
本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filename):从CSV文件导入 ...
pandas操作
python中使用了pandas的一些操作,特此记录下来: 生成DataFrame import pandas as pd data = pd.DataFrame({ 'v_id': ["v ...
Python openpyxl、pandas操作Excel方法简介与具体实例
本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据 ...

随机推荐

Ubuntu常用环境配置
gcc sudo apt-get install build-essential update-alternatives 管理python环境 # 添加版本 # update-alternatives ...
heimaJava18_线程
Java 线程单线程线程(thread)是一个程序内部的一条执行路径. main方法的执行其实就是一个单独的执行路径程序中如果只有一条执行路径,那么这个程序就是单线程的程序多线程多线程是指从 ...
PHP递归的简单理解
递归简单来说就是自己调用自己比如说 A向B问路但是B不知道于是乎B问C 但是C不知道于是乎问D D知道 D把怎么走告诉C C在把怎么走告诉B B再把怎么走告诉A A虽然是最先问的但是是最后一 ...
Edge 访问网站强制HTTPS
edge://net-internals/#hsts 1)開啟Edge chromium 瀏覽器,輸入edge://net-internals/#hsts,開啟設定介面2)找到 Delete doma ...
postman打开白屏
1.打开高级系统设置:2.在"高级"选项卡中,单击"环境变量":3.添加一个新的系统变量:POSTMAN_DISABLE_GPU=true4.关闭Postman ...
微信支付服务商api对接
引入官方sdk  < ...
Chrome(谷歌)浏览器永久关闭恢复页面提示框（记录）
使用脚本调用Chrome浏览器启动指定页面,然后代码里的命令关闭,会被浏览器识别为非正常关闭. 再次执行脚本的时候会停留在空白页面,无法进入指定页面,设置为主页也无法进入. 排查可能是浏览器自动恢复页 ...
Json对象转换模块（自编代码JsonObject.cs）
namespace 信息采集系统.Common { /// <summary> /// Json类型对象,用于其它Json对象继承 /// </summary> /// < ...
入门VUEX
我对VUEX的理解就是,vuex提供了一个数据仓库相比较vue里的 data{ return{ ****:**, ***:*** } } vuex提供的仓库会一直在项目 ...
VulnHub靶场练习之 grotesque：2
步骤1:信息收集拿到靶机首先看一下开放的端口可以看到开放了很多端口比如22 ssh.80 http等等那么就先访问一下80看一下页面没有什么有用的东西查看一下网页源代码也没有找到什么有价 ...

pandas操作excle

读取Excel文件：

读取指定的Excel表单：

写入数据到Excel文件：

追加数据到Excel文件：

选择Excel表单中的列：

选择Excel表单中的行：

过滤Excel表单中的行：

按列排序：

按列分组并求和：

对Excel表单中的列应用函数：

使用Pivot表：

插入新的行：

插入新的列：

删除行：

删除列：

重命名列：

修改单元格的值：

使用多重索引：

读取多个Excel文件并合并：

选择特定的单元格：

拆分Excel表单中的列：

将Excel表单中的列合并：

将Excel表单中的日期列格式化：

根据Excel表单中的某一列填充空值：

根据Excel表单中的某一列去除重复行：

将Excel表单中的数字列格式化为百分比：

将Excel表单中的数字列四舍五入：

根据Excel表单中的某一列进行透视：

计算Excel表单中列的总数：

统计Excel表单中每个值的数量：

pandas操作excle的更多相关文章

随机推荐

热门专题