数据类型-DataFrame
数据类型-DataFrame
- DataFrame是由多个Series数据列组成的表格数据类型,每行Series值都增加了一个共用的索引
- 既有行索引,又有列索引
- 行索引,表明不同行,横向索引,叫index,0轴,axis=0
- 列索引,表名不同列,纵向索引,叫columns,1轴,axis=1
- DataFrame数据类型可视为:二维 带标签 数组
- 每列值的类型可以不同
- 基本操作类似Series,依据行列索引操作
- 常用于表达二维数据,但也可以表达多维数据(Dataframe嵌套,极少用)
DataFrame数据类型创建
Python list列表 创建DataFrame
df = pd.DataFrame([True,1,2.3,'a','你好']) #1维 df = pd.DataFrame([[True,1,2.3,'a','你好'],[1,2,3,4,5]]) #2维 df = pd.DataFrame([[[True,1,2.3,'a','你好'],[1,2,3,4,5]],[[True,1,2.3,'a','你好'],[1,2,3,4,5]]]) #3维,不建议
Python 字典 创建DataFrame
df = pd.DataFrame({'one':[1,2,3,4],'two':[9,8,7,6]})
df = pd.DataFrame({'one':[1,2,3,4],'two':[9,8,7,6]},index = ['a','b','c','d']) #自定义行索引
df = pd.DataFrame({
'A' : 1,
'B' : 2.3,
'C' : ['x','y',5] #需要多行
})
dt = {
'one':pd.Series([1,2,3],index=['a','b','c']),
'two':pd.Series([9,8,7,6],index=['a','b','c','d',])
}
d = pd.DataFrame(dt) #one two自动列索引,abcd自动行索引.每个元素对应DataFrame的一列,每个元素内的键值对应一行
pd.DataFrame(dt,index=['b','c','d'],columns=['two','three']) #数据根据行列索引自动补齐
ndarray数组 创建DataFrame
df = pd.DataFrame(np.arange(10).reshape(2,5)) #自动生成行/列索引 df = pd.DataFrame(np.random.randn(6,4),index=[1,2,3,4,5,6],columns=['a','b','c','d']) #自定义行列索引
Series 创建DataFrame
e = pd.DataFrame([pd.Series([1,2,3]),pd.Series([9,8,7,6])],index=['a','b'])
DataFrame属性
di = {
'姓名':['张三','李四','王五','赵六'],
'性别':['男','女','女','男'],
'年龄':[12,22,32,42],
'地址':['北京','上海','广州','深圳']
}
d = pd.DataFrame(di,index=['d1','d2','d3','d4'])
d
d.head() # 显示头部几行
d.tail(3) # 显示末尾几行
d.info() # 相关信息概览
d.shape # 行数 列数
d.dtypes # 列数据类型
d.index # 获取行索引
d.columns # 获取列索引
d.values # 获取值
数据类型-DataFrame的更多相关文章
- Pandas 1 表格数据类型DataFrame
# -*- encoding:utf-8 -*- # Copyright (c) 2015 Shiye Inc. # All rights reserved. # # Author: ldq < ...
- DataFrame按行读取:DataFrame之values
http://blog.csdn.net/u014607457/article/details/51290582 def fill_core(self): RatingTable=pd.read_cs ...
- Pandas python
原文: https://github.com/catalystfrank/Python4DataScience.CH 和大熊猫们(Pandas)一起游戏吧! Pandas是Python的一个 ...
- 数据摘要pandas
主要是用于分析数据的Pandas库 先学习两个数据类型DataFrame和series 进一步学习利用Pandas进行摘要的方法, 提取数据的特征 1 pandas库 1.1 pandas库 pand ...
- 十分钟了解pandas
十分钟掌握Pandas(上)--来自官网API 一.numpy和pandas numpy是矩阵计算库,pandas是数据分析库,关于百度百科,有对pandas的介绍. pandas 是基于NumPy ...
- 十分钟掌握Pandas(上)——来自官网API
十分钟掌握Pandas(上)——来自官网API 其实不止10分钟,这么多,至少一天 一.numpy和pandas numpy是矩阵计算库,pandas是数据分析库,关于百度百科,有对pandas的介绍 ...
- Datawhale学数据分析第一章
需要用到的基础知识pandas基础知识参考1,2章https://github.com/datawhalechina/joyful-pandas 1.导入数据tsv 制表符作为分隔符的字段符csv 逗 ...
- dataframe中的数据类型及转化
1 float与str的互化 import pandas as pd import numpy as np df = pd.DataFrame({'a':[1.22, 4.33], 'b':[3.44 ...
- JDBC的ResultSet游标转spark的DataFrame,数据类型的映射以TeraData数据库为例
1.编写给ResultSet添加spark的schema成员及DF(DataFrame)成员 /* spark.sc对象因为是全局的,没有导入,需自行定义 teradata的字段类型转换成spark的 ...
随机推荐
- Go随机数的使用
随机数使用比较广泛,例如,抽奖.均衡等等. 下面简单说明其使用方法. Example1 package main import ( "log" "math/rand&qu ...
- 【python】序列切片和range函数
序列的每个元素都可以用2种索引的表达方式,一种是正数索引,另一种是负数索引. 序列切片,作用是访问序列中一定范围的元素,格式“序列名[A:B]”,其中A为所切片的第一个元素的索引号,而B为切片后剩下的 ...
- ASP.NET 实现验证码以及刷新验证码
实现代码 /// <summary> /// 生成验证码图片,保存session名称VerificationCode /// </summary> public static ...
- Hadoop高级培训课程大纲-管理员版
一.课程概述 本次培训课程主要面向大数据系统管理人员和开发设计人员,基于开源社区大数据应用最活跃的Hadoop和HBase技术框架.围绕分布式文件存储(HDFS).分布式并行计算(Map/Recue) ...
- python-并发测试用例
以前看了虫师的并发,然后觉得以后如果遇上领导要求一个模块里的并发怎么办,然后就想到了下面的方法: 代码: 在原有的基础下再往casedir数组加模块三里面细分的对象.(这里可以封装成函数调用,工作需要 ...
- java-appium-527手机浏览器、PC端程序、grid模式
1.手机浏览器 2.window通用成语自动化 3.appium支持grid模式
- CentOS下Apache默认安装路径
apache:如果采用RPM包安装,安装路径应在 /etc/httpd目录下apache配置文件:/etc/httpd/conf/httpd.confApache模块路径:/usr/sbin/apac ...
- 6.15-初识JSP、javaweb
一.javaweb web服务器 tomcat C/S 客户端/服务器 B/S 浏览器/服务器 URL: http协议 https 加密的协议 localhost 127.0.0.1 常用web服务器 ...
- 朴素贝叶斯-对数似然Python实现-Numpy
<Machine Learning in Action> 为防止连续乘法时每个乘数过小,而导致的下溢出(太多很小的数相乘结果为0,或者不能正确分类) 训练: def trainNB0(tr ...
- PreApplicationStartMethodAttribute的使用
先预备一个类,用于Start时调用 public static class MyPreApplicationStart { public static void RegisterGlobalFilte ...