基本内容

Series:

  • Series 是有一组数据(numpy的数据类型 numpy.ndarray)以及一组数据标签(即索引)组成,可以看成一个一个定长的有序字典(索引值到数据值的一个映射)

obj = Series([4, 7, -5, 3])
print(type(obj))
print(type(obj.values))
obj.values

<class 'pandas.core.series.Series'>
<class 'numpy.ndarray'>

array([ 4,  7, -5,  3], dtype=int64)

  • 创建:

    • 通过序列 + index,index 默认为自然数
obj2 = Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])
obj2.values.tolist()
    • 通过字典
obj2 = Series({'d': 4, 'b': 7, 'a': -5, 'c': 3})
obj2.to_dict()

DataFrame

  • 介绍:

    • 表型数据结构,可以看做有多个拥有同一索引的Series构成的字典
  • 创建:
    • 通过字典(平铺) + index + columns :
data = {
'state': ['a', 'a', 'a', 'b', 'b'],
'year': [2000, 2001, 2002, 2001, 2002],
'pop': [1.5, 1.7, 3.6, 2.4, 2.9]
}
df = DataFrame(data=data)
print("df=", df)

注: index, columns 均为list, 如果没有给定,则为默认, index 默认为自然数,columns 默认为按照它排序

    • 通过嵌套字典:
data = {
'state': {0: 'a', 1: 'a', 2: 'a', 3: 'b', 4: 'b'},
'year': {0: 2000, 1: 2001, 2: 2002, 3: 2001, 4: 2002},
'pop': {0: 1.5, 1: 1.7, 2: 3.6, 3: 2.4, 4: 2.9}
}
df = DataFrame(data=data)
print("df=", df)

state year pop
a a 2000 1.5
b a 2001 1.7
c a 2002 3.6
d b 2001 2.4
e b 2002 2.9

    • 二维 ndarray, 数组、列表,元组,可以加入行,列label
data3 = [['a', 2000, 1.5],
['a', 2001, 1.7],
['a', 2002, 3.6],
['b', 2001, 2.4],
['b', 2002, 2.9]]
  • 列(特征访问),默认的访问对象, 结果为一个Series:

    • 通过属性的方式: df.state
    • 通过字典的方式: df["state"]
  • 行访问,通过访问索引,结果为一个Series:
    • ix:被下面2个代替
    • loc : 访问的索引值,即行值 index label
    • iloc : 访问的索引行,即行号,index position
  • 索引的重置:
    • reindex(列表a, method="ffill"):按照a进行重新排列样本数据,源索引不存在,样本添加缺少值, method 缺失值的填充方式
    • set_index(n) : 参数为字符串(列)或者列的序列,集合。函数会将一个或多个列转换为行索引,并创建新的DataFrame
    • reset_index() :  以当前顺序删除旧的索引,重新生成新索引(自然数)

pandas 初识(一)的更多相关文章

  1. pandas初识

    pandas初识 1.生成DataFrame型的数据 import pandas as pd import numpy as np dates = pd.date_range('20130101',p ...

  2. pandas 初识(四)

    Pandas 和 sqlalchemy 配合实现分页查询 Mysql 并获取总条数 @api.route('/show', methods=["POST"]) def api_sh ...

  3. pandas 初识(三)

    Python Pandas 空值 pandas 判断指定列是否(全部)为NaN(空值) import pandas as pd import numpy as np df = pd.DataFrame ...

  4. pandas 初识(二)

    基本统计 pivot_table(数据透视表 ): 使用appfunc, 按不同index分类统计各特征values的值 df.pivot_table(index="Pclass" ...

  5. pandas 初识(六)-可视化

    Pandas 在一张图中绘制多条线 import pandas as pd import numpy as npimport matplotlib.pyplot as plt df = pd.Data ...

  6. pandas 初识(五)

    1. 如何实现把一个属性(列)拆分成多列,产生pivot,形成向量信息,计算相关性? 例: class_ timestamp count 0 10 2019-01-20 13:23:00 1 1 10 ...

  7. numpy最后一部分及pandas初识

    今日内容概要 numpy剩余的知识点 pandas模块 今日内容详细 二元函数 加 add 减 sub 乘 mul 除 div 平方 power 数学统计方法 sum 求和 cumsum 累计求和 m ...

  8. 日常记录-Pandas Cookbook

    Cookbook 1.更新内容 2.关于安装 3.Pandas使用注意事项 4.包环境 5.10分钟Pandas初识 6.教程 7.Cookbook 8.数据结构简介 9.基本功能 10.使用文本数据 ...

  9. Pandas学习整理与实践

    Part 1. Pandas初识 作为一款数据处理工具,Pandas本身集成了Numpy(数据计算处理)及matplotlib(绘图),其便捷的数据处理能力.方便的文件读写以及支持多维度的表示方式使其 ...

随机推荐

  1. 运维安全之Tripwire

    转自网络 Tripwire是最为著名的unix下文件系统完整性检查的软件工具,这一软件采用的技术核心就是对每个要监控的文件产生一个数字签名,保留下来. 当文件现在的数字签名与保留的数字签名不一致时,那 ...

  2. Windows:服务已经标记为删除

    解决办法: 方法一:运行删除服务项命令的时候,服务管理窗口未关闭,关闭服务管理窗口即可: 方法二:删除服务的注册表项,路径为: HKEY_LOCAL_MACHINE\SYSTEM\CurrentCon ...

  3. MFC 常用功能总结

    目录 ◆ 获取启动参数◆ 调整窗体大小◆ 关闭Dialog窗体◆ Dialog启动时指定控件为焦点◆ Dialog中禁止ESC回车关闭窗体◆ 回车后焦点自动跳到下一个控件◆ 窗体中某个控件捕获右键菜单 ...

  4. tomcat8.5 Host-Manager配置访问的方法

    1. 安装配置tomcat服务器,浏览器输入 localhost:8080,可正常访问主页,但访问localhost:8080/host-manager, localhost:8080/manager ...

  5. jdk1.7环境配置

    JDK1.7的环境配置(我的是jdk1.7,文件名写快了,忽略忽略) 官网下载自己需要的版本(ps:我这是朋友发给我的就不提供官网地址,去百度搜jdk就可以了) 下载下来除了改存放路径还有记得再jdk ...

  6. SecureCRT Win免安装版本,简单好用

    SecureCRT是一款支持SSH(SSH1和SSH2)的终端仿真程序,简单地说是Windows下登录UNIX或Linux服务器主机的软件. 这个简单好用,程序员必备. 下载地址:SecureCRT. ...

  7. C 语言之预处理 ---------文件包括

    文件包括是C预处理程序的还有一个重要功能. 文件包括命令行的一般形式为: #include"文件名称" 在前面我们已多次用此命令包括过库函数的头文件. 比如: #include&q ...

  8. 【转】Tomcat连接器:Coyote框架

    不论Tomcat的容器设计得如何精妙,本质上Tomcat就是个http服务器,需要从socket中获得HTTP数据流:另一方面,容器只能处理封装好的org.apache.coyote.Request ...

  9. Docker技术入门与实战 第二版-学习笔记-4-Dockerfile外其他生成镜像的方法

    其它生成镜像的方法 即除了标准地使用Dockerfile来生成镜像外,还有一些其他的方法 1)从 rootfs 压缩包导入 格式:docker import [选项] <文件>|<U ...

  10. Node.js实战(七)之交互式解释器

    Node.js REPL(Read Eval Print Loop:交互式解释器) 表示一个电脑的环境,类似 Window 系统的终端或 Unix/Linux shell,我们可以在终端中输入命令,并 ...