pandas操作excle
Python是一门强大的编程语言,也是数据科学领域中最流行的语言之一。在处理数据时,很多时候需要与Excel进行交互,以进行数据读取、清理和分析。Python中有很多工具可以与Excel进行交互,其中pandas是其中最受欢迎的库之一。在本文中,我们将介绍如何使用Python和pandas进行Excel文件操作,并讨论一些常用的pandas方法。
读取Excel文件:
import pandas as pd
df = pd.read_excel('example.xlsx')
读取指定的Excel表单:
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
写入数据到Excel文件:
df.to_excel('example.xlsx', sheet_name='Sheet1', index=False)
追加数据到Excel文件:
with pd.ExcelWriter('example.xlsx', mode='a') as writer:
df.to_excel(writer, sheet_name='Sheet1', index=False)
选择Excel表单中的列:
df = pd.read_excel('example.xlsx')
selected_cols = ['col1', 'col2']
df_selected = df[selected_cols]
选择Excel表单中的行:
df = pd.read_excel('example.xlsx')
selected_rows = df.loc[df['col1'] == 'value1']
过滤Excel表单中的行:
df = pd.read_excel('example.xlsx')
filtered_rows = df[df['col1'].str.contains('value')]
按列排序:
df = pd.read_excel('example.xlsx')
sorted_df = df.sort_values(by='col1')
按列分组并求和:
df = pd.read_excel('example.xlsx')
grouped_df = df.groupby('col1').sum()
对Excel表单中的列应用函数:
df = pd.read_excel('example.xlsx')
df['new_col'] = df['col1'].apply(lambda x: x * 2)
使用Pivot表:
df = pd.read_excel('example.xlsx')
pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')
插入新的行:
df = pd.read_excel('example.xlsx')
new_row = pd.DataFrame({'col1': 'value1', 'col2': 'value2'}, index=[0])
df = pd.concat([new_row, df]).reset_index(drop=True)
插入新的列:
df = pd.read_excel('example.xlsx')
new_col = pd.Series(['value1', 'value2'])
df['new_col'] = new_col
删除行:
df = pd.read_excel('example.xlsx')
df = df.drop(df[df['col1'] == 'value1'].index)
删除列:
df = pd.read_excel('example.xlsx')
df = df.drop('col1', axis=1)
重命名列:
df = pd.read_excel('example.xlsx')
df = df.rename(columns={'col1': 'new_col1', 'col2': 'new_col2'})
修改单元格的值:
df = pd.read_excel('example.xlsx')
df.loc[df['col1'] == 'value1', 'col2'] = 'new_value'
使用多重索引:
df = pd.read_excel('example.xlsx')
df = df.set_index(['col1', 'col2'])
读取多个Excel文件并合并:
import os
path = 'path/to/files'
all_files = os.listdir(path)
all_excels = [file for file in all_files if file.endswith('.xlsx')]
dfs = [pd.read_excel(os.path.join(path, file)) for file in all_excels]
merged_df = pd.concat(dfs)
选择特定的单元格:
df = pd.read_excel('example.xlsx')
cell_value = df.at[0, 'col1']
拆分Excel表单中的列:
df = pd.read_excel('example.xlsx')
split_cols = df['col1'].str.split('-', expand=True)
split_cols.columns = ['col1_part1', 'col1_part2']
将Excel表单中的列合并:
df = pd.read_excel('example.xlsx')
df['col1'] = df['col1'].astype(str) + '-' + df['col2'].astype(str)
将Excel表单中的日期列格式化:
df = pd.read_excel('example.xlsx')
df['date_col'] = pd.to_datetime(df['date_col'], format='%Y-%m-%d')
根据Excel表单中的某一列填充空值:
df = pd.read_excel('example.xlsx')
df['col1'] = df['col1'].fillna(method='ffill')
根据Excel表单中的某一列去除重复行:
df = pd.read_excel('example.xlsx')
df = df.drop_duplicates(subset='col1')
将Excel表单中的数字列格式化为百分比:
df = pd.read_excel('example.xlsx'
df['percentage_col'] = df['percentage_col'].apply(lambda x: '{:.2%}'.format(x))
将Excel表单中的数字列四舍五入:
df = pd.read_excel('example.xlsx')
df['decimal_col'] = df['decimal_col'].round(2)
根据Excel表单中的某一列进行透视:
df = pd.read_excel('example.xlsx')
pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')
计算Excel表单中列的总数:
df = pd.read_excel('example.xlsx')
col_total = df['col1'].sum()
统计Excel表单中每个值的数量:
df = pd.read_excel('example.xlsx')
value_counts = df['col1'].value_counts()
pandas操作excle的更多相关文章
- pandas操作行集锦
pandas移花接木 数据准备两表: 我们接下来要进行的操作: 增 将两表进行合并 # 把两张表合并,但是这样有问题,索引会重复的进行0-19 students = page_001.append(p ...
- pandas操作,感觉不错,复制过来的
整理pandas操作 本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filenam ...
- Python之Pandas操作csv文件dataframe
# -*- coding: utf-8 -*- # author:baoshan import pandas as pd def main(): aqi_data = pd.read_csv('chi ...
- python 操作excle 之第三方库 openpyxl学习
目录 python 操作excle 之第三方库 openpyxl学习 安装 pip install openpyxl 英文文档链接 : 点击这里~ 1,定位excel 2,读取excle中的内容 3, ...
- Java操作Excle(基于Poi)
有一次有个同事问我会不会有java操作Excle,回答当然是不会了!感觉被嘲讽了,于是开始寻找度娘,找到个小例子,结果越写越有意思,最后就成就了这个工具类. import java.io.Buffer ...
- Python Pandas操作Excel
Python Pandas操作Excel 前情提要 ☟ 本章使用的 Python3.6 Pandas==0.25.3 项目中需要用到excel的文件字段太多 考虑到后续字段命名的变动以及中文/英文/日 ...
- Pandas 操作
一.Series的创建: pd.Series([ 数据 ]) In [17]: import pandas as pd In [18]: import numpy as np In [19]: s = ...
- 整理pandas操作
本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filename):从CSV文件导入 ...
- pandas操作
python中使用了pandas的一些操作,特此记录下来: 生成DataFrame import pandas as pd data = pd.DataFrame({ 'v_id': ["v ...
- Python openpyxl、pandas操作Excel方法简介与具体实例
本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据 ...
随机推荐
- Ubuntu常用环境配置
gcc sudo apt-get install build-essential update-alternatives 管理python环境 # 添加版本 # update-alternatives ...
- heimaJava18_线程
Java 线程 单线程 线程(thread)是一个程序内部的一条执行路径. main方法的执行其实就是一个单独的执行路径 程序中如果只有一条执行路径,那么这个程序就是单线程的程序 多线程 多线程是指从 ...
- PHP递归的简单理解
递归简单来说就是自己调用自己 比如说 A向B问路 但是B不知道 于是乎B问C 但是C不知道 于是乎问D D知道 D把怎么走告诉C C在把怎么走告诉B B再把怎么走告诉A A虽然是最先问的 但是是最后一 ...
- Edge 访问网站强制HTTPS
edge://net-internals/#hsts 1)開啟Edge chromium 瀏覽器,輸入edge://net-internals/#hsts,開啟設定介面2)找到 Delete doma ...
- postman打开白屏
1.打开高级系统设置:2.在"高级"选项卡中,单击"环境变量":3.添加一个新的系统变量:POSTMAN_DISABLE_GPU=true4.关闭Postman ...
- 微信支付服务商api对接
引入官方sdk <!--微信v3支付sdk {https://github.com/wechatpay-apiv3/wechatpay-apache-httpclient}--> < ...
- Chrome(谷歌)浏览器永久关闭恢复页面提示框(记录)
使用脚本调用Chrome浏览器启动指定页面,然后代码里的命令关闭,会被浏览器识别为非正常关闭. 再次执行脚本的时候会停留在空白页面,无法进入指定页面,设置为主页也无法进入. 排查可能是浏览器自动恢复页 ...
- Json对象转换模块(自编代码JsonObject.cs)
namespace 信息采集系统.Common { /// <summary> /// Json类型对象,用于其它Json对象继承 /// </summary> /// < ...
- 入门VUEX
我对VUEX的理解就是,vuex提供了一个数据仓库 相比较vue里的 data{ return{ ****:**, ***:*** } } vuex提供的仓库会一直在项目 ...
- VulnHub靶场练习之 grotesque:2
步骤1:信息收集 拿到靶机首先看一下开放的端口 可以看到开放了很多端口 比如22 ssh.80 http等等 那么就先访问一下80看一下 页面没有什么有用的东西 查看一下网页源代码 也没有找到什么有价 ...