关于pandas的一些用法
pandas用法之前我总是把他想的无比复杂。其实也是比较简单的,这个东西在做数据统计的时候还是挺好用的。
然后这里列举几个比较好用的几段代码。偏向数据透视类型pivot的,导出方式是直接在IDE 生成。
import pandas as pd
df = pd.read_excel(r'C:\Users\yjiang3\Desktop\VBA\22.xlsx')
pd.pivot_table(df,index=["DocumentTypeName","DocumentId"])#选取不同的索引
#如果第一个索引在excel里有大量的重复,就会只生成一个 然后对应不同的下一个索引
然后这个index就是索引, 里面的DocumentTypeName 会自动成为一列。
import numpy as np
import pandas as pd
df = pd.read_excel(r'C:\Users\yjiang3\Desktop\VBA\22.xlsx')
pd.pivot_table(df,index=["DataAnalyst","CountryId"],values=["ShareClassCount"],columns=["ProcessStatusName"],aggfunc=[np.sum],fill_value=0)
然后这个这一组pivot数据结构,先加上索引,计算shareclasscout,(这里要用到numpy 不然算不出来)然后多添加一列columns索引,aggfunc计算之和。
fill_value 设置为零,虽然不知道是什么意思。
import pandas as pd
path = r'C:\Users\yjiang3\Desktop\VBA\22.xlsx'
data = pd.DataFrame(pd.read_excel(path))
result = data.loc[data['DataAnalyst'] == 'Skylar.Yin@morningstar.com'] print(result)
然后来个筛选项:
import pandas as pd
path = r'C:\Users\yjiang3\Desktop\VBA\22.xlsx'
data = pd.DataFrame(pd.read_excel(path))
result = data.loc[data['DataAnalyst'] == 'Skylar.Yin@morningstar.com']
print(result)
来个小总结:
关于pandas的一些用法的更多相关文章
- Pandas之groupby( )用法笔记
groupby官方解释 DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True ...
- Pandas中Loc用法总结
摘自:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html 具体用法,假设数据源为: > ...
- pandas Timestamp的用法
(Timestamp('2018-08-01 00:00:00'), <class 'pandas._libs.tslibs.timestamps.Timestamp'>) 注意这里面的T ...
- numpy和pandas和matplotlib用法
numpy result = [ [0, 10, 20, 30, 40], [10, 23, 33, 43, 53], [20, 83, 23, 55, 33], [30, 93, 44, 22, 5 ...
- python3 pandas DataFrame常见用法
df = pandas.read_clipboard() df 获取索引和值 df.index df.values DataFrame的values属性将数据以二维ndarray形式返回,dtype类 ...
- pandas的DataFrame用法
用来生成DataFrame数据 1.说明: class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=F ...
- Py修行路 Pandas 模块基本用法
pandas 安装方法:pip3 install pandas pandas是一个强大的Python数据分析的工具包,它是基于NumPy构建的模块. pandas的主要功能: 具备对其功能的数据结构D ...
- Pandas的基本用法
Pandas是使用python进行数据分析不可或缺的第三方库.我们已经知道,NumPy的ndarray数据结构能够很好地进行数组运算,但是当我们需要进行为数据添加标签,处理缺失值,对数据分组,创建透视 ...
- pandas.Series函数用法
class pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False) e.g., ...
- python之pandas模块高级用法
一 agg,聚合,可以使用内置的函数 >>> import pandas as pd >>> import numpy as np >>> pp ...
随机推荐
- 基于Mybatis Plus的一种查询条件构建方案
! 重要: 遐(瞎)想的思路, 希望各位多多建议 record为jdk17写法, 使用class也不会有问题 背景 身为资深程序员, 上班最重要的事当然是增删改查(bushi). 比如今天, 组长甩给 ...
- 安装netbense时提示在此计算机中找不到Java SE开发工具包(JDK)
在提示信息中显示的需要JDK8或更高版本,这边需要提醒大家不要把jdk8和jdk1.8弄混 首先大家打开控制面板找到程序并点击进去 点击程序和功能 在电脑上查看是否有java8或更高版本的内容如果没有 ...
- Java基础__05.网络编程
通信协议 即约定网络通信时的一些内容. TCP和UDP对比 TCP:类比打电话 连接稳定 三次握手.四次挥手 客户端.服务端 传输完成.释放连接,效率低 UDP:类比发短信 不连接.不稳定: 客户端. ...
- 【git】3.2git分支-分支的新建与合并
资料来源 (1) https://git-scm.com/book/zh/v2/Git-%E5%88%86%E6%94%AF-%E5%88%86%E6%94%AF%E7%9A%84%E6%96%B0% ...
- unity 利用相机截图,可以截取UI,保存png格式,可用于签名抠图
public Camera cam; void Start() { StartCoroutine(CaptureAlphaCamera(cam,new Rect(0,0,1920,1080))); } ...
- redis geo 做距离计算排序分页
redis geo 做距离计算排序分页 // 添加经纬度和店铺id geoadd store_list lng lat store_id 计算距离排序和生成临时文件 georadius store_l ...
- Python学习:Mysql(三)索引
1.索引 索引是表的目录,在查找内容之前可以先在目录中查找索引位置,以此快速定位查询数据.对于索引,会保存在额外的文件中. 2.索引种类 普通索引:仅加速查询 唯一索引:加速查询 + 列值唯一(可以有 ...
- Jquery EasyUI dataGrid 修改默认分页大小 不起效果
pageSize 不能单独使用,必须和pageList联合使用. 如果pageSize的值不在pageList中时,会以pageList中最小的值显示,而设置的pageSize无效.
- python批量更改文件名并移动到新的文件夹
python批量更改文件名并移动到新的文件夹 前言: 1. 这里的代码以批量命名如: 路径"E:\下载\1\xxxx.mp4"."E:\下载\2\xxxx.mp4&quo ...
- SQLSERVER 根据一个库的视图在另一个库中生成一张表
select * into VPsiOuntStockBill from [KshDbPro].dbo.VPsiOuntStockBill