pandas用法之前我总是把他想的无比复杂。其实也是比较简单的,这个东西在做数据统计的时候还是挺好用的。

然后这里列举几个比较好用的几段代码。偏向数据透视类型pivot的,导出方式是直接在IDE 生成。

import pandas as pd
df = pd.read_excel(r'C:\Users\yjiang3\Desktop\VBA\22.xlsx')
pd.pivot_table(df,index=["DocumentTypeName","DocumentId"])#选取不同的索引
#如果第一个索引在excel里有大量的重复,就会只生成一个 然后对应不同的下一个索引

然后这个index就是索引, 里面的DocumentTypeName 会自动成为一列。

import numpy as np
import pandas as pd
df = pd.read_excel(r'C:\Users\yjiang3\Desktop\VBA\22.xlsx')
pd.pivot_table(df,index=["DataAnalyst","CountryId"],values=["ShareClassCount"],columns=["ProcessStatusName"],aggfunc=[np.sum],fill_value=0)

然后这个这一组pivot数据结构,先加上索引,计算shareclasscout,(这里要用到numpy 不然算不出来)然后多添加一列columns索引,aggfunc计算之和。

fill_value 设置为零,虽然不知道是什么意思。

import pandas as pd
path = r'C:\Users\yjiang3\Desktop\VBA\22.xlsx'
data = pd.DataFrame(pd.read_excel(path))
result = data.loc[data['DataAnalyst'] == 'Skylar.Yin@morningstar.com'] print(result)

然后来个筛选项:

import pandas as pd
path = r'C:\Users\yjiang3\Desktop\VBA\22.xlsx'
data = pd.DataFrame(pd.read_excel(path))
result = data.loc[data['DataAnalyst'] == 'Skylar.Yin@morningstar.com']
print(result)

来个小总结:

关于pandas的一些用法的更多相关文章

  1. Pandas之groupby( )用法笔记

    groupby官方解释 DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True ...

  2. Pandas中Loc用法总结

    摘自:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.loc.html 具体用法,假设数据源为: > ...

  3. pandas Timestamp的用法

    (Timestamp('2018-08-01 00:00:00'), <class 'pandas._libs.tslibs.timestamps.Timestamp'>) 注意这里面的T ...

  4. numpy和pandas和matplotlib用法

    numpy result = [ [0, 10, 20, 30, 40], [10, 23, 33, 43, 53], [20, 83, 23, 55, 33], [30, 93, 44, 22, 5 ...

  5. python3 pandas DataFrame常见用法

    df = pandas.read_clipboard() df 获取索引和值 df.index df.values DataFrame的values属性将数据以二维ndarray形式返回,dtype类 ...

  6. pandas的DataFrame用法

    用来生成DataFrame数据 1.说明: class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=F ...

  7. Py修行路 Pandas 模块基本用法

    pandas 安装方法:pip3 install pandas pandas是一个强大的Python数据分析的工具包,它是基于NumPy构建的模块. pandas的主要功能: 具备对其功能的数据结构D ...

  8. Pandas的基本用法

    Pandas是使用python进行数据分析不可或缺的第三方库.我们已经知道,NumPy的ndarray数据结构能够很好地进行数组运算,但是当我们需要进行为数据添加标签,处理缺失值,对数据分组,创建透视 ...

  9. pandas.Series函数用法

    class pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False) e.g., ...

  10. python之pandas模块高级用法

    一 agg,聚合,可以使用内置的函数 >>> import pandas as pd >>> import numpy as np >>> pp ...

随机推荐

  1. 基于Mybatis Plus的一种查询条件构建方案

    ! 重要: 遐(瞎)想的思路, 希望各位多多建议 record为jdk17写法, 使用class也不会有问题 背景 身为资深程序员, 上班最重要的事当然是增删改查(bushi). 比如今天, 组长甩给 ...

  2. 安装netbense时提示在此计算机中找不到Java SE开发工具包(JDK)

    在提示信息中显示的需要JDK8或更高版本,这边需要提醒大家不要把jdk8和jdk1.8弄混 首先大家打开控制面板找到程序并点击进去 点击程序和功能 在电脑上查看是否有java8或更高版本的内容如果没有 ...

  3. Java基础__05.网络编程

    通信协议 即约定网络通信时的一些内容. TCP和UDP对比 TCP:类比打电话 连接稳定 三次握手.四次挥手 客户端.服务端 传输完成.释放连接,效率低 UDP:类比发短信 不连接.不稳定: 客户端. ...

  4. 【git】3.2git分支-分支的新建与合并

    资料来源 (1) https://git-scm.com/book/zh/v2/Git-%E5%88%86%E6%94%AF-%E5%88%86%E6%94%AF%E7%9A%84%E6%96%B0% ...

  5. unity 利用相机截图,可以截取UI,保存png格式,可用于签名抠图

    public Camera cam; void Start() { StartCoroutine(CaptureAlphaCamera(cam,new Rect(0,0,1920,1080))); } ...

  6. redis geo 做距离计算排序分页

    redis geo 做距离计算排序分页 // 添加经纬度和店铺id geoadd store_list lng lat store_id 计算距离排序和生成临时文件 georadius store_l ...

  7. Python学习:Mysql(三)索引

    1.索引 索引是表的目录,在查找内容之前可以先在目录中查找索引位置,以此快速定位查询数据.对于索引,会保存在额外的文件中. 2.索引种类 普通索引:仅加速查询 唯一索引:加速查询 + 列值唯一(可以有 ...

  8. Jquery EasyUI dataGrid 修改默认分页大小 不起效果

    pageSize 不能单独使用,必须和pageList联合使用. 如果pageSize的值不在pageList中时,会以pageList中最小的值显示,而设置的pageSize无效.

  9. python批量更改文件名并移动到新的文件夹

    python批量更改文件名并移动到新的文件夹 前言: 1. 这里的代码以批量命名如: 路径"E:\下载\1\xxxx.mp4"."E:\下载\2\xxxx.mp4&quo ...

  10. SQLSERVER 根据一个库的视图在另一个库中生成一张表

    select * into VPsiOuntStockBill from [KshDbPro].dbo.VPsiOuntStockBill