1、条件查询:

result = df.query("((a==1 and b=="x") or c/d < 3))"
print result

2、遍历

a)根据索引遍历

for  idx in df.index:
  dd = df.loc[idx]
  print(dd)

b)按行遍历

for  i in range(0, len(df)):
  dd = df.iloc[i]
  print(dd)

3、对某列求均值

# 对“volume”列求均值
result = df["volume"].mean()
print(result)

4、按照指定列排序

result_df = df.sort_values(by="sales" , ascending=False)
print(result_df)

注意,以上排序,非inplace

5、提取特定行/列

如有数据:

        code          update_time  last_price  open_price     ...      option_gamma  option_vega  option_theta  option_rho
42 HK.02018 2019-04-26 16:08:05 53.70 52.70 ... NaN NaN NaN NaN
15 HK.00151 2019-04-26 16:08:33 6.17 6.21 ... NaN NaN NaN NaN
14 HK.00101 2019-04-26 16:08:05 18.22 18.26 ... NaN NaN NaN NaN

a)按照索引提取

提取索引为42的行和所有列:

result = df.loc[42, :]
print(result)

result:

        code          update_time  last_price  open_price     ...      option_gamma  option_vega  option_theta  option_rho
42 HK.02018 2019-04-26 16:08:05 53.70 52.70 ... NaN NaN NaN NaN

提取索引为15,42的数据,  只需要code和update_time两列:

result = df.loc[[15,42], [0,2]]
print(result)

result:

        code          update_time
42 HK.02018 2019-04-26 16:08:05
15 HK.00151 2019-04-26 16:08:33

b)按行提取

提取第2行的数据, 所有列:

result = df.iloc[1, :]
print(result)

result:

       code          update_time  last_price  open_price     ...      option_gamma  option_vega  option_theta  option_rho
15 HK.00151 2019-04-26 16:08:33 6.17 6.21 ... NaN NaN NaN NaN

提取前2行的数据, 所有列:

result = df.iloc[0:2, :]
print(result)

result:

        code          update_time  last_price  open_price     ...      option_gamma  option_vega  option_theta  option_rho
42 HK.02018 2019-04-26 16:08:05 53.70 52.70 ... NaN NaN NaN NaN
15 HK.00151 2019-04-26 16:08:33 6.17 6.21 ... NaN NaN NaN NaN

提取1、3行的数据, 只需要code和update_time两列:

result = df.iloc[[0,2], 0:2]
print(result)

result:

        code          update_time
42 HK.02018 2019-04-26 16:08:05
14 HK.00101 2019-04-26 16:08:05

6、复制列

df['col']=df['col1']+df['col2']

将col1和col2相除的结果加1,放入新的newcol列:

df['newcol']=df['col1']/df['col2']+1

7、重命名列

new_df = df.rename(columns={'oldName1': 'newName1', 'oldName2': 'newName2'})
print(new_df)
# inplace模式
df.rename(columns={'oldName1': 'newName1', 'oldName2': 'newName2'}, inplace=True)
print(df)

python panda::dataframe常用操作的更多相关文章

  1. 二叉树的python可视化和常用操作代码

    二叉树是一个重要的数据结构, 本文基于"二叉查找树"的python可视化 pybst 包, 做了一些改造, 可以支持更一般的"二叉树"可视化. 关于二叉树和二叉 ...

  2. pyspark dataframe 常用操作

    spark dataframe派生于RDD类,但是提供了非常强大的数据操作功能.当然主要对类SQL的支持.   在实际工作中会遇到这样的情况,主要是会进行两个数据集的筛选.合并,重新入库.   首先加 ...

  3. Python数据类型及常用操作

    Python字符串类型 1.用途: 用来记录有描述性的状态.比如:人名,地址等. 2.定义方式: 创建字符串非常简单,在‘ ’,“ ”,‘’‘ ’‘’内一填写一系列的字符例如:msg='hello' ...

  4. Python字符串的常用操作学习

    >>> name = "I love my job!" >>> name.capitalize() #首字母大写 'I love my job! ...

  5. Python集合的常用操作

    字典常用的就是,他的去重. set集合是python的一个基本数据类型. set中的元素是不重复的.⽆无序的.⾥面的元素必须是可hash的(int, str, tuple,bool). 我们可以这样来 ...

  6. python os 模块常用操作

    python 2.7 os 常用操作 官方document链接 文件和目录 os.access(path, mode) 读写权限测试 应用: try: fp = open("myfile&q ...

  7. 初识python: 字符串常用操作

    直接上代码示例: #!/user/bin env python # author:Simple-Sir # time:20180914 # 字符串常用操作 name = 'lzh lyh' print ...

  8. R 语言的Dataframe常用操作

    上节我们简单介绍了Dataframe的定义,这节我们具体来看一下Dataframe的操作 首先,数据框的创建函数为 data.frame( ),参考R语言的帮助文档,我们来了解一下data.frame ...

  9. python selenium 基本常用操作

    最近学习UI自动化,把一些常用的方法总结一下,方便自己以后查阅需要.因本人水平有限,有不对之处多多包涵!欢迎指正! 一.xpath模糊匹配定位元素 武林至尊,宝刀屠龙刀(xpath),倚天不出(css ...

随机推荐

  1. 【原创】Linux基础之redhat6升级glibc-2.12到2.14

    redhat6自带glibc-2.12,升级到glibc-2.14过程 # strings /lib64/libc.so.6 |grep GLIBC_GLIBC_2.2.5GLIBC_2.2.6GLI ...

  2. maven历史版本下载地址

    http://archive.apache.org/dist/maven/maven-3/

  3. 26)django-form字段和插件widgets

    创建Form类时,主要涉及到 [字段] 和 [插件],字段用于对用户请求数据的验证,插件用于自动生成HTML 一:常用字段 1.Django中Form类内置字段如下: 用于保存正则表达式 Choice ...

  4. vue源码分析之new Vue过程

    实例化构造函数 从这里可以看出new Vue实际上是使vue构造函数实例化,然后调用_init方法 _init方法,该方法在 src/core/instance/init.js 中定义 Vue.pro ...

  5. 剑指offer数组列表

    一.数组 面试题3 : 找出数组中重复的数字 面试题3(二):不修改数组找出重复的数字 面试题4:二维数组的查找 面试题21:调整数组顺序使奇数位于偶数前面 面试题39:数组中出现次数超过一半的数字 ...

  6. Zabbix(一)

    安装一台CentOS: CentOS-7.4-x86_64-DVD-1708 https://www.cnblogs.com/xiewenming/p/7732144.html https://blo ...

  7. python第九天(9-33)

    一:进程 进程概念 进程就是一个程序运行在一个数据集上的一次动态执行过程 进程一般由程序,数据集,进程控制块组成 进程控制块: 进程控制块用来记录进程的外部特征,描述进程的执行变化过程,系统可以利用它 ...

  8. 使用java的Calendar工具类获取到本月的第一天起始时间和最后一天结束时间。

    1.使用java的Calendar工具类获取到本月的第一天起始时间和最后一天结束时间. package com.fline.aic.utils; import java.text.DateFormat ...

  9. kth min_max容斥

    题解: 普通的$min-max$容斥是用来求最后出现元素的期望之类的 $kth min-max$容斥进一步解决倒数第k个出现的元素的期望 给出公式: $kthmax(S)=\sum\limits_{T ...

  10. 03.DataStructure

    01.list ''' list 특징 - 1차원 배열 구조 형식) 변수 = [값1, 값2] - 다양한 자료형 저장 가능 - index 사용=순서 존재 형식) 변수[n] - 값 수정( ...