获取列名：
data.columns.values.tolist()

复制列：

out['serial_number'] = out['2']
这样就是新增了一列，复制了‘2’这一列，然后再del out['2]即可
这样的形式也可以用于把前面某些列的计算值赋到新的一列

换列名：

#给data_app赋上新的列名称
data_app.columns = ['user_id', 'hlw_all3', 'vedio_app_time', 'game_app_time', 'read_app_time', 'music_app_time', 'dm_app_time', 'toutiao_app_time']

根据某一列的值取出符合条件的所有行：

data_sp = data[data['$AS-TwoStep'] == 'Cluster-1']
该句意思为取出$AS-TwoStep这一列为cluster-1的所有数据

Python pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 121, saw 2

读取数据报这个错误时添加

delimiter="\t"，例如：

data1 = pd.read_csv(f1, low_memory=False, delimiter="\t")
就可以了

pandas导出数据时不想要序号的话就写一句  index=False就行了

读取dataframe的第N列：
df['列名']

读取dataframe的第N行：
df[行数：行数+1]
比如：读第0行   df[0:1]

将dataframe利用df.values.tolist()转化为列表时会出现大列表套小列表的情况
如果想避免这种情况，只要大列表，可以先将dataframe通过df['user_id']转化为series，然后再利用series.tolist()转化为列表，这样就只有一个大列表

想把一列中的空值全部变为0
https://blog.csdn.net/chenpe32cp/article/details/82180537

定位dateframe某行某列的一条数据：
df.iat[行，列]

dataframe处理行列
https://blog.csdn.net/kevin_7july/article/details/79377234

查看数据是否有缺失
import numpy as np 
#查看是否有数据缺失
print np.any(red.isnull()==True)

dataframe常用处理的更多相关文章

R 语言的Dataframe常用操作
上节我们简单介绍了Dataframe的定义,这节我们具体来看一下Dataframe的操作首先,数据框的创建函数为 data.frame( ),参考R语言的帮助文档,我们来了解一下data.frame ...
pyspark dataframe 常用操作
spark dataframe派生于RDD类,但是提供了非常强大的数据操作功能.当然主要对类SQL的支持. 在实际工作中会遇到这样的情况,主要是会进行两个数据集的筛选.合并,重新入库. 首先加 ...
Pandas 之 DataFrame 常用操作
import numpy as np import pandas as pd This section will walk you(引导你) through the fundamental(基本的) ...
python panda::dataframe常用操作
1.条件查询: result = df.query("((a==1 and b=="x") or c/d < 3))" print result 2.遍历 ...
《Python数据分析常用手册》一、NumPy和Pandas篇
一.常用链接: 1.Python官网:https://www.python.org/ 2.各种库的whl离线安装包:http://www.lfd.uci.edu/~gohlke/pythonlibs/ ...
Pandas常用操作方法
Pandas pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. pandas提 ...
NumPy和Pandas常用库
NumPy和Pandas常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数 ...
小记--------sparksql和DataFrame的小小案例java、scala版本
sparksql是spark中的一个模块,主要用于进行结构化数据的处理,他提供的最核心的编程抽象,就是DataFrame.同时,sparksql还可以作为分布式的sql查询引擎. 最最重要的功能就是从 ...
pandas中的数据结构-DataFrame
pandas中的数据结构-DataFrame DataFrame是什么? 表格型的数据结构 DataFrame 是一个表格型的数据类型,每列值类型可以不同 DataFrame 既有行索引.也有列索引 ...

随机推荐

RDIFramework.NET ━ .NET快速信息化系统开发框架 V3.2版本正式发布
RDIFramework.NET .NET快速信息化系统开发框架 V3.2版本正式发布精益求精求完美! 1.RDIFramework.NET框架介绍 RDIFramework.NET,基于.NE ...
es6涉及的那点东西
前言 ECMAScript 6(以下简称ES6)是JavaScript语言的下一代标准.因为当前版本的ES6是在2015年发布的,所以又称ECMAScript 2015. 也就是说,ES6就是ES20 ...
网站集群架构（LVS负载均衡、Nginx代理缓存、Nginx动静分离、Rsync+Inotify全网备份、Zabbix自动注册全网监控）--技术流ken
前言最近做了一个不大不小的项目,现就删繁就简单独拿出来web集群这一块写一篇博客.数据库集群请参考<MySQL集群架构篇:MHA+MySQL-PROXY+LVS实现MySQL集群架构高可用/高 ...
与其想当然的 overdesign，不如自己动手做个试验
Conmajia Jan. 29th, 2019 早在2012年,我曾经针对 C# System.Random 不同的初始化方案专门做过一次试验,得出了单次默认初始化即可获得质量很好的随机数的结论.可 ...
【带着canvas去流浪】（2）绘制折线图
目录一. 任务说明二. 重点提示三. 示例代码 3.1 一般折线图 3.2 用贝塞尔曲线绘制平滑折线图四. 大数据量场景示例代码托管在:https://github.com/dashnowo ...
OO第二单元总结
这一单元作业是围绕电梯调度进行展开,并引进了多线程的概念.与第一次作业比较类似,作业难度也是逐渐推进,从最开始的单部电梯先来先服务(傻瓜式调度),到之后的单部电梯可稍带调度,到最后的多部电梯分楼层调度 ...
Dynamics 365-关于BPF的进一步探究
关于BPF是什么,以及如何在CRM中配置BPF,可以参阅熊宸大神的博客Dynamics 365 Business Process Flow -- 让你不再惧怕复杂的业务流程! 1. CRM中发生了什么 ...
生鲜配送管理系统_升鲜宝 V2.0 小程序辅助系统工具矩阵系列相关说明
随着微信红利的进一步释放,使用人群的不断增加,小程序从2017年01月第一批开发者出现后,2018年小程序得到快速的提升,小程序开发的相关应用小工具得到了市场的青咪,社会化大分工.协同.共享.协作的思 ...
Android RecyclerView初探
今天研究了一下RecyclerView,RecyclerView比ListView的效率更高而且可以横向滑动,所以现在许多Android项目更倾向与使用RecyclerView. 下面是一个Recyc ...
解决laravel Class 'Doctrine\DBAL\Driver\PDOMySql\Driver' not found 错误
这个错误的原因来自于没有安装一个依赖库: 官方文档说明如下: Modifying Columns Prerequisites Before modifying a column, be sure to ...

dataframe常用处理

Python pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 121, saw 2

dataframe常用处理的更多相关文章

随机推荐

热门专题