dataframe 用法总结

http://pda.readthedocs.io/en/latest/chp5.html

data = [] 列表初始化

data = (,)

data = {} 字典初始化

data = pd.DataFrame() dataframe 初始化

data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'],

        'year': [2000, 2001, 2002, 2001, 2002],

        'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}

frame = DataFrame(data)
想列扩展就直接用data['month'] =[1,2,4,5,7]

DataFrame有行名称index和列名称columns 的属性： dataframe.index /dataframe.columns
DataFrame的 index 和 columns 有它们的 name ，也会被显示出来：

frame3.values   # 返回一个ndarry

DataFrame 的列名取法： 
data = pd.DataFrame()
data.columns          #查看列名
data.columns = ['','','',''] # 改名

DataFrame 还有values 属性（返回一个包含在DataFrame中的数据的二维ndarray） 机器学习建模经常用它来获取ndarray

DataFrame 的某一列可以用字典记忆法来检索
data['year']   # [2000, 2001, 2002, 2001, 2002]
DataFrame 的某一列也可用属性来检索

data.year      # [2000, 2001, 2002, 2001, 2002]

DataFrame 的某一列也可用位置来检索

data.ix[0:,1] #

pop = {'Nevada': {2001: 2.4, 2002: 2.9}, 'Ohio': {2000: 1.5, 2001: 1.7, 2002: 3.6}} # 嵌套字典

内部字典的键被结合并排序来形成结果的索引。

DataFrame(pop, index=[2001, 2002, 2003])

数据写到文件

a = {‘c’：[], 'd':[], 'e':[]}

b = pd.DataFrame(a)

b.to_csv('file.csv')

2维数组数据索引： c[:3,:] # 从c0，c1，c2. c[3:,:] # 取值从 c3，c4，c5

c = b.values # c就变成了ndarray 类型

c[:3,:] #表示从c0，c1，c2. c[3:,:] # 取值从 c3，c4，c5

b是dataframe型。 b.ix[:3,:] # 索引会到b0,b1,b2,b3

dataframe 用法总结的更多相关文章

pandas的DataFrame用法
用来生成DataFrame数据 1.说明: class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=F ...
DataFrame编程模型初谈与Spark SQL
Spark SQL在Spark内核基础上提供了对结构化数据的处理,在Spark1.3版本中,Spark SQL不仅可以作为分布式的SQL查询引擎,还引入了新的DataFrame编程模型. 在Spark ...
Python：pandas（三）——DataFrame
官方文档:pandas之DataFrame 1.构造函数用法 pandas.DataFrame( data=None, index=None, columns=None, dtype=None, ) ...
Python爬虫系列 - 初探：爬取新闻推送
Get发送内容格式 Get方式主要需要发送headers.url.cookies.params等部分的内容. t = requests.get(url, headers = header, param ...
JAVA开发搞了一年多的大数据，究竟干了点啥
JAVA开发搞了一年多大数据的总结 2021年7月份加入了当前项目组,以一个原汁原味的Java开发工程师的身份进来的,来了没多久,项目组唯一一名大数据开发工程师要离职了,一时间一大堆的数据需求急需 ...
pandas-03 DataFrame()中的iloc和loc用法
pandas-03 DataFrame()中的iloc和loc用法简单的说: iloc,即index locate 用index索引进行定位,所以参数是整型,如:df.iloc[10:20, 3:5 ...
转化dataframe中一组序列为时间序列的方法-to_datetime()的最新用法
一.to_datetime()的最新用法: hs300_hf['date'] = pd.to_datetime(hs300_hf['date']) hs300_hf.set_index('date', ...
dataframe的一些用法
pandas中Dataframe的一些用法 pandas读取excel文件 pd.read_excel 前提是安装xlrd库 dataframe,numpy,list之间的互相转换 dataframe ...
python3 pandas DataFrame常见用法
df = pandas.read_clipboard() df 获取索引和值 df.index df.values DataFrame的values属性将数据以二维ndarray形式返回,dtype类 ...

随机推荐

一种 jquery 检索方案
整理自:http://www.cnblogs.com/linjiqin/archive/2011/03/18/1988464.html <!DOCTYPE HTML PUBLIC "- ...
Oracle创建实例
1.打开database configuration assistant 2.下一步 3.下一步 4.完成 5.添加完密码后,点击关闭.
对实体 "useSSL" 的引用必须以 ';' 分隔符结尾。
<property name="connection.url">jdbc:mysql://127.0.0.1/cache?useUnicode=true&cha ...
完整的CRUD——javaweb
1,总体架构 index是进去的页面, 可以跳转Insert的增加页面,operatePerson是根据传进来的URI来判断增删改查的页面, DbManager.java是封装的数据库操作类, Pag ...
Bundle的使用
a.Activity1发送: Intent intent = new Intent(); intent.setClass(activity1.this, activity2.class); / ...
解决VS2008 调试启动特别慢
Resolving Very Slow Symbol Loading with VS 2008 during debugging Recently, I was encountering insane ...
linux用rdate命令实现同步时间
用rdate命令实现同步时间前两天说到用ntp时间服务器和ntpdate命令同步时间,今天简单记录下用rdate同步时间 http://blog.csdn.net/wyzxg/archive/201 ...
解决eclipse Blocked : the user operation is waiting
本文转载自:http://blog.csdn.net/shaw1994/article/details/44106679 出现这种情况的时候整个adb都跪了, eclipse一run就会跪, 而且还容 ...
juc线程池原理(六)：jdk线程池中的设计模式
一.jdk中默认线程池中的代理模式单例类线程池只有一个线程,无边界队列,适合cpu密集的运算.jdk中创建线程池是通过Executors类中提供的静态的方法来创建的,其中的单例类线程池的方法如下: ...
mina中责任链模式的实现
一.mina的框架回顾责任链模式在mina中有重要的作用,其中Filter机制就是基于责任链实现的. 从上图看到消息的接受从IoService层先经过Filter层过滤处理后最后交给IoHander ...

dataframe 用法总结

dataframe 用法总结的更多相关文章

随机推荐

热门专题