Python是一门强大的编程语言,也是数据科学领域中最流行的语言之一。在处理数据时,很多时候需要与Excel进行交互,以进行数据读取、清理和分析。Python中有很多工具可以与Excel进行交互,其中pandas是其中最受欢迎的库之一。在本文中,我们将介绍如何使用Python和pandas进行Excel文件操作,并讨论一些常用的pandas方法。

读取Excel文件:

  1. import pandas as pd
  2. df = pd.read_excel('example.xlsx')

读取指定的Excel表单:

  1. df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

写入数据到Excel文件:

  1. df.to_excel('example.xlsx', sheet_name='Sheet1', index=False)

追加数据到Excel文件:

  1. with pd.ExcelWriter('example.xlsx', mode='a') as writer:
  2. df.to_excel(writer, sheet_name='Sheet1', index=False)

选择Excel表单中的列:

  1. df = pd.read_excel('example.xlsx')
  2. selected_cols = ['col1', 'col2']
  3. df_selected = df[selected_cols]

选择Excel表单中的行:

  1. df = pd.read_excel('example.xlsx')
  2. selected_rows = df.loc[df['col1'] == 'value1']

过滤Excel表单中的行:

  1. df = pd.read_excel('example.xlsx')
  2. filtered_rows = df[df['col1'].str.contains('value')]

按列排序:

  1. df = pd.read_excel('example.xlsx')
  2. sorted_df = df.sort_values(by='col1')

按列分组并求和:

  1. df = pd.read_excel('example.xlsx')
  2. grouped_df = df.groupby('col1').sum()

对Excel表单中的列应用函数:

  1. df = pd.read_excel('example.xlsx')
  2. df['new_col'] = df['col1'].apply(lambda x: x * 2)

使用Pivot表:

  1. df = pd.read_excel('example.xlsx')
  2. pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

插入新的行:

  1. df = pd.read_excel('example.xlsx')
  2. new_row = pd.DataFrame({'col1': 'value1', 'col2': 'value2'}, index=[0])
  3. df = pd.concat([new_row, df]).reset_index(drop=True)

插入新的列:

  1. df = pd.read_excel('example.xlsx')
  2. new_col = pd.Series(['value1', 'value2'])
  3. df['new_col'] = new_col

删除行:

  1. df = pd.read_excel('example.xlsx')
  2. df = df.drop(df[df['col1'] == 'value1'].index)

删除列:

  1. df = pd.read_excel('example.xlsx')
  2. df = df.drop('col1', axis=1)

重命名列:

  1. df = pd.read_excel('example.xlsx')
  2. df = df.rename(columns={'col1': 'new_col1', 'col2': 'new_col2'})

修改单元格的值:

  1. df = pd.read_excel('example.xlsx')
  2. df.loc[df['col1'] == 'value1', 'col2'] = 'new_value'

使用多重索引:

  1. df = pd.read_excel('example.xlsx')
  2. df = df.set_index(['col1', 'col2'])

读取多个Excel文件并合并:

  1. import os
  2. path = 'path/to/files'
  3. all_files = os.listdir(path)
  4. all_excels = [file for file in all_files if file.endswith('.xlsx')]
  5. dfs = [pd.read_excel(os.path.join(path, file)) for file in all_excels]
  6. merged_df = pd.concat(dfs)

选择特定的单元格:

  1. df = pd.read_excel('example.xlsx')
  2. cell_value = df.at[0, 'col1']

拆分Excel表单中的列:

  1. df = pd.read_excel('example.xlsx')
  2. split_cols = df['col1'].str.split('-', expand=True)
  3. split_cols.columns = ['col1_part1', 'col1_part2']

将Excel表单中的列合并:

  1. df = pd.read_excel('example.xlsx')
  2. df['col1'] = df['col1'].astype(str) + '-' + df['col2'].astype(str)

将Excel表单中的日期列格式化:

  1. df = pd.read_excel('example.xlsx')
  2. df['date_col'] = pd.to_datetime(df['date_col'], format='%Y-%m-%d')

根据Excel表单中的某一列填充空值:

  1. df = pd.read_excel('example.xlsx')
  2. df['col1'] = df['col1'].fillna(method='ffill')

根据Excel表单中的某一列去除重复行:

  1. df = pd.read_excel('example.xlsx')
  2. df = df.drop_duplicates(subset='col1')

将Excel表单中的数字列格式化为百分比:

  1. df = pd.read_excel('example.xlsx'
  2. df['percentage_col'] = df['percentage_col'].apply(lambda x: '{:.2%}'.format(x))

将Excel表单中的数字列四舍五入:

  1. df = pd.read_excel('example.xlsx')
  2. df['decimal_col'] = df['decimal_col'].round(2)

根据Excel表单中的某一列进行透视:

  1. df = pd.read_excel('example.xlsx')
  2. pivot_table = pd.pivot_table(df, values='col1', index='col2', columns='col3', aggfunc='sum')

计算Excel表单中列的总数:

  1. df = pd.read_excel('example.xlsx')
  2. col_total = df['col1'].sum()

统计Excel表单中每个值的数量:

  1. df = pd.read_excel('example.xlsx')
  2. value_counts = df['col1'].value_counts()

pandas操作excle的更多相关文章

  1. pandas操作行集锦

    pandas移花接木 数据准备两表: 我们接下来要进行的操作: 增 将两表进行合并 # 把两张表合并,但是这样有问题,索引会重复的进行0-19 students = page_001.append(p ...

  2. pandas操作,感觉不错,复制过来的

    整理pandas操作 本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filenam ...

  3. Python之Pandas操作csv文件dataframe

    # -*- coding: utf-8 -*- # author:baoshan import pandas as pd def main(): aqi_data = pd.read_csv('chi ...

  4. python 操作excle 之第三方库 openpyxl学习

    目录 python 操作excle 之第三方库 openpyxl学习 安装 pip install openpyxl 英文文档链接 : 点击这里~ 1,定位excel 2,读取excle中的内容 3, ...

  5. Java操作Excle(基于Poi)

    有一次有个同事问我会不会有java操作Excle,回答当然是不会了!感觉被嘲讽了,于是开始寻找度娘,找到个小例子,结果越写越有意思,最后就成就了这个工具类. import java.io.Buffer ...

  6. Python Pandas操作Excel

    Python Pandas操作Excel 前情提要 ☟ 本章使用的 Python3.6 Pandas==0.25.3 项目中需要用到excel的文件字段太多 考虑到后续字段命名的变动以及中文/英文/日 ...

  7. Pandas 操作

    一.Series的创建: pd.Series([ 数据 ]) In [17]: import pandas as pd In [18]: import numpy as np In [19]: s = ...

  8. 整理pandas操作

    本文原创,转载请标识出处: http://www.cnblogs.com/xiaoxuebiye/p/7223774.html 导入数据: pd.read_csv(filename):从CSV文件导入 ...

  9. pandas操作

    python中使用了pandas的一些操作,特此记录下来: 生成DataFrame import pandas as pd data = pd.DataFrame({ 'v_id': ["v ...

  10. Python openpyxl、pandas操作Excel方法简介与具体实例

    本篇重点讲解windows系统下 Python3.5中第三方excel操作库-openpyxl: 其实Python第三方库有很多可以操作Excel,如:xlrd,xlwt,xlwings甚至注明的数据 ...

随机推荐

  1. docker安装nginx挂载启动

    docker pull nginx 命令安装 查找 Docker Hub 上的 nginx 镜像: docker search nginx 这里我们拉取官方的镜像 docker pull nginx ...

  2. Ubuntu实战

    Ubuntu是什么 Ubuntu早期是一个由Debian Linux发展起来的以桌面应用为主的操作系统.作为Linux发行版中的后起 之秀,Ubuntu Linux在短短几年时间里便迅速成长为从Lin ...

  3. Spring 笔记三 AOP

    1.AOP 概述 AOP (Aspect-Oriented  Programming,面向切面编程):是一种新的方法论,是对传统 OOP (Object-Oriented  Programming,面 ...

  4. 使用git&GitHub通过两台电脑协同作业,助力办公室摸鱼

    前情提要:工作有时候负荷比较小,会接一些咸鱼上的活儿或者自己学点软件技能,这时候会出现一个情况,公司笔记本一般不带回家,家里台式机,白天在公司摸鱼编辑的文件,晚上回家想接着干怎么办呢,或是晚上在家干的 ...

  5. 1.HTML中的标签

    1.HTML的基础标签 <!--        -->  表示注释 1)  html语言是解释型语言,不是编译型 浏览器是容错的2)  html页面中由一对标签组成:<html> ...

  6. lc.59 螺旋矩阵 II

    题目描述 给你一个正整数 n ,生成一个包含 1 到 n2 所有元素,且元素按顺时针顺序螺旋排列的 n x n 正方形矩阵 matrix . 示例 输入:n = 3 输出:[[1,2,3],[8,9, ...

  7. [vue2 + jointjs + svg-pan-zoom] 节点自动布局渲染 + 拖拽缩放

    启动vue项目,执行以下命令安装dagre.graphlib.jointjs.svg-pan-zoom. npm install dagre graphlib jointjs svg-pan-zoom ...

  8. springboot整合flowable-初步入门

    最近工作中有用到工作流的开发,引入了flowable工作流框架,在此记录一下springboot整合flowable工作流框架的过程,以便后续再次使用到时可以做一些参考使用,如果项目中有涉及到流程审批 ...

  9. Sitecore 应用与介绍

    前言 因为工作需要,开始了 sitecore 之旅,在使用之中碰到了许多问题,后续开始写一下关于 sitecore 的文章. sitecore 官网:https://www.sitecore.com/ ...

  10. Linux & 标准C语言学习 <DAY6>

    一.数组     什么是数组:变量的组合,是一种批量定义相同类型变量的方式     定义:  类型名 数组名[数量];             int arr[5];             注意:数 ...