pandas 常用清洗数据（二）

1、

df.head()

Here we import pandas using the alias 'pd', then we read in our data.

df.head - shows us the first  rows and headers - it gives us an idea what to expect. df.tail - shows us the last  rows

2、

n []: df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],

   ...:                     'B': ['B0', 'B1', 'B2', 'B3'],

   ...:                     'C': ['C0', 'C1', 'C2', 'C3'],

   ...:                     'D': ['D0', 'D1', 'D2', 'D3']},

   ...:                     index=[, , , ])

   ...: `

In []: df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],

   ...:                     'B': ['B4', 'B5', 'B6', 'B7'],

   ...:                     'C': ['C4', 'C5', 'C6', 'C7'],

   ...:                     'D': ['D4', 'D5', 'D6', 'D7']},

   ...:                      index=[, , , ])

   ...:

In []: df3 = pd.DataFrame({'A': ['A8', 'A9', 'A10', 'A11'],

   ...:                     'B': ['B8', 'B9', 'B10', 'B11'],

   ...:                     'C': ['C8', 'C9', 'C10', 'C11'],

   ...:                     'D': ['D8', 'D9', 'D10', 'D11']},

   ...:                     index=[, , , ])

In frames = [df1, df2, df3]
In [5]: result = pd.concat(frames)
result = df1.append([df2, df3])

2、copy and value_counts

df2 = df.copy()

df2.DATE.value_counts().sort_index() //sort by index

data_print = data['vote_count'].value_counts().sort_index()

df['Amount'] = pd.to_numeric(df['Amount'])

3, add del

del df2['column_name']

del df2['column_name']

del df2['column_name']

df.insert(loc=, column='Country', value='UK')
data.insert(0, '性别', data.pop('gender'))#pop返回删除的列，插入到第0列，并取新名为'性别'

4、筛选：

bool = dt.str.contains   # df 是Series类型，不是DataFrame类型

                                   #返回的是True，False

#获取筛选数据

xuan_data =dt[bool]  #True的

pandas 常用清洗数据（二）的更多相关文章

pandas 常用清洗数据（三）排序，去重
1.排序 DataFrame 按照Index排序 Series.order()进行排序,而DataFrame则用sort或者sort_index或者sort_values 2.去重, dt = dt. ...
pandas 常用清洗数据（一）
数据源获取: https://www.kaggle.com/datasets 1. Look at the some basic stats for the ‘imdb_score’ column: ...
【转】Pandas学习笔记（二）选择数据
Pandas学习笔记系列: Pandas学习笔记(一)基本介绍 Pandas学习笔记(二)选择数据 Pandas学习笔记(三)修改&添加值 Pandas学习笔记(四)处理丢失值 Pandas学 ...
Python3 Pandas的DataFrame数据的增、删、改、查
Python3 Pandas的DataFrame数据的增.删.改.查一.DataFrame数据准备增.删.改.查的方法有很多很多种,这里只展示出常用的几种. 参数inplace默认为False,只 ...
Pandas常用操作方法
Pandas pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具. pandas提 ...
Python数据分析与挖掘所需的Pandas常用知识
Python数据分析与挖掘所需的Pandas常用知识前言Pandas基于两种数据类型:series与dataframe.一个series是一个一维的数据类型,其中每一个元素都有一个标签.series ...
NumPy和Pandas常用库
NumPy和Pandas常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数 ...
Python数据分析之Pandas读写外部数据文件
1 引言数据分析.数据挖掘.可视化是Python的众多强项之一,但无论是这几项中的哪一项都必须以数据作为基础,数据通常都存储在外部文件中,例如txt.csv.excel.数据库.本篇中,我们来捋一捋 ...
Pandas常用数据结构
Pandas 概述 Pandas(Python Data Analysis Library)是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的.Pandas 纳入了大量库和一些标准的数 ...

随机推荐

关于js中的时间——计算时间差等
获取当前(系统)时间: var NowDate= new Date(); // 获取当前日期时间 // 输出为: Wed May 03 2017 14:52:08 GMT+0800 (中国标准时间) ...
《机器学习实战》Logistic回归
注释:Ng的视频有完整的推到步骤,不过理论和实践还是有很大差别的,代码实现还得完成 1.Logistic回归理论 http://www.cnblogs.com/wjy-lulu/p/7759515.h ...
mke2fs
mke2fs - create an ext2/ext3/ext4 filesystem # mke2fs -b -c -N -t ext4 /dev/sdb #(注意末尾是/dev/sdb....? ...
Java压缩图片的实现类
package com.function; import java.awt.geom.AffineTransform; import java.awt.image.AffineTransformOp; ...
UVA-714-二分+贪心
题意:K个人复制M本书,每本书有Pi页,要求每个人都能分到至少一本书,如果分到多本书籍,分到的书籍编号是连续的,并且K个人里面分到的书籍总页数最大的那个人总数最小. 如果有多组解,保证 K1 < ...
10.纯 CSS 创作一个同心圆弧旋转 loader 特效
原文地址:https://segmentfault.com/a/1190000014682999 想到了扇形:正方形 ->border-radius: 50%; ->取四份中的任意一份. ...
SD-WAN供应商列表
SD-WAN的一个重要思想是,可以使用任何类型的多个物理WAN链路来承载流量,而无需网络工程师进行大量工程设计.相反,SD-WAN解决方案在物理基础设施之上运行覆盖(隧道),抽象出实际链接. SD-W ...
C# 趣味小程序（4）——遍历特定目录及其子目录
//递归方法遍历目录,并统计其中文件的数目 private int statisticFiles(string directory) { int st ...
关于 jquery+ajax向asp.net传递json的问题研究（呕心沥血、柳暗花明）
第一种方法:字典的方法 //质检不合格 $('#Button3').click(function () { if (!confirm('确定质检不合格吗?')) return; var obj = n ...
SSO单点登录、跨域重定向、跨域设置Cookie、京东单点登录实例分析
最近在研究SSO单点登录技术,其中有一种就是通过js的跨域设置cookie来达到单点登录目的的,下面就已京东商城为例来解释下跨域设置cookie的过程涉及的关键知识点: 1.jquery ajax跨 ...

pandas 常用清洗数据（二）

pandas 常用清洗数据（二）的更多相关文章

随机推荐

热门专题