pandas 初识（一）

基本内容

Series:

Series 是有一组数据（numpy的数据类型 numpy.ndarray）以及一组数据标签（即索引）组成，可以看成一个一个定长的有序字典（索引值到数据值的一个映射）

obj = Series([4, 7, -5, 3])

print(type(obj))

print(type(obj.values))

obj.values

array([ 4, 7, -5, 3], dtype=int64)

创建：
- 通过序列 + index，index 默认为自然数

obj2 = Series([4, 7, -5, 3], index=['d', 'b', 'a', 'c'])
obj2.values.tolist()

- 通过字典

obj2 = Series({'d': 4, 'b': 7, 'a': -5, 'c': 3})
obj2.to_dict()

DataFrame

介绍：
- 表型数据结构，可以看做有多个拥有同一索引的Series构成的字典
创建：
- 通过字典（平铺） + index + columns ：

data = {

    'state': ['a', 'a', 'a', 'b', 'b'],

    'year': [2000, 2001, 2002, 2001, 2002],

    'pop': [1.5, 1.7, 3.6, 2.4, 2.9]

}

df = DataFrame(data=data)

print("df=", df)

注： index， columns 均为list，如果没有给定，则为默认， index 默认为自然数，columns 默认为按照它排序

- 通过嵌套字典：

data = {

    'state': {0: 'a', 1: 'a', 2: 'a', 3: 'b', 4: 'b'},

    'year': {0: 2000, 1: 2001, 2: 2002, 3: 2001, 4: 2002},

    'pop': {0: 1.5, 1: 1.7, 2: 3.6, 3: 2.4, 4: 2.9}

}

df = DataFrame(data=data)

print("df=", df)

state year pop
a a 2000 1.5
b a 2001 1.7
c a 2002 3.6
d b 2001 2.4
e b 2002 2.9

- 二维 ndarray，数组、列表，元组，可以加入行，列label

data3 = [['a', 2000, 1.5],

       ['a', 2001, 1.7],

       ['a', 2002, 3.6],

       ['b', 2001, 2.4],

       ['b', 2002, 2.9]]

列（特征访问）,默认的访问对象，结果为一个Series：
- 通过属性的方式： df.state
- 通过字典的方式： df["state"]
行访问，通过访问索引，结果为一个Series：
- ix：被下面2个代替
- loc : 访问的索引值，即行值 index label
- iloc : 访问的索引行，即行号，index position
索引的重置：
- reindex(列表a, method="ffill")：按照a进行重新排列样本数据，源索引不存在，样本添加缺少值, method 缺失值的填充方式
- set_index(n) ：参数为字符串（列）或者列的序列，集合。函数会将一个或多个列转换为行索引，并创建新的DataFrame
- reset_index() : 以当前顺序删除旧的索引，重新生成新索引（自然数）

pandas 初识（一）的更多相关文章

pandas初识
pandas初识 1.生成DataFrame型的数据 import pandas as pd import numpy as np dates = pd.date_range('20130101',p ...
pandas 初识（四）
Pandas 和 sqlalchemy 配合实现分页查询 Mysql 并获取总条数 @api.route('/show', methods=["POST"]) def api_sh ...
pandas 初识（三）
Python Pandas 空值 pandas 判断指定列是否(全部)为NaN(空值) import pandas as pd import numpy as np df = pd.DataFrame ...
pandas 初识（二）
基本统计 pivot_table(数据透视表 ): 使用appfunc, 按不同index分类统计各特征values的值 df.pivot_table(index="Pclass" ...
pandas 初识(六）-可视化
Pandas 在一张图中绘制多条线 import pandas as pd import numpy as npimport matplotlib.pyplot as plt df = pd.Data ...
pandas 初识（五）
1. 如何实现把一个属性(列)拆分成多列,产生pivot,形成向量信息,计算相关性? 例: class_ timestamp count 0 10 2019-01-20 13:23:00 1 1 10 ...
numpy最后一部分及pandas初识
今日内容概要 numpy剩余的知识点 pandas模块今日内容详细二元函数加 add 减 sub 乘 mul 除 div 平方 power 数学统计方法 sum 求和 cumsum 累计求和 m ...
日常记录-Pandas Cookbook
Cookbook 1.更新内容 2.关于安装 3.Pandas使用注意事项 4.包环境 5.10分钟Pandas初识 6.教程 7.Cookbook 8.数据结构简介 9.基本功能 10.使用文本数据 ...
Pandas学习整理与实践
Part 1. Pandas初识作为一款数据处理工具,Pandas本身集成了Numpy(数据计算处理)及matplotlib(绘图),其便捷的数据处理能力.方便的文件读写以及支持多维度的表示方式使其 ...

随机推荐

客户端连接caching-sha2-password问题
ALTER USER 'root'@'localhost' IDENTIFIED BY '123' PASSWORD EXPIRE NEVER;ALTER USER 'root'@'localhost ...
SQL Server 查询表的字段对应描述、数据类型、长度
create procedure proc_view_cloumns ( ) ) AS select b.name,a.value,c.name, b.max_length from sys.exte ...
Python脚本性能分析
来自:http://www.cnblogs.com/btchenguang/archive/2012/02/03/2337112.html def foo(): sum = 0 for i in ra ...
[Python_4] Python 面向对象(OOP)
0. 说明 Python 面向对象(OOP) 笔记.迭代磁盘文件.析构函数.内置方法.多重继承.异常处理参考 Python面向对象 1. 面向对象 # -*-coding:utf-8-*- &quo ...
Windows 下的文件被占用问题解决
windows下,经常容易出现文件被其他程序占用的现象,令人十分头疼.更头疼的是,还看不到被谁占用. 实际上是有办法看到占用的进程的. 话不多说,以Win10为例: 1.打开资源监视器 a.直接程序栏 ...
开源作业调度框架 - Quartz.NET - ASP.NET部署
经过这次使用实践,感觉Quartz.NET使用起来方便快捷但是在发布部署时我们会遇到一个问题那就是当Web应用程序经常没有按照预计的时间去执行. 那问题出在哪里了呢? 根据以往的经验很容易就可以找 ...
Maven 安装源码和文档到本地仓库
一: 1: mvn source:jar 生成源码的jar包 2: mvn source:jar install 将源码安装到本地仓库 ,可以直接mvn source:jar install 一部 ...
php可逆加密解密函数
很多PHP程序员调试使用echo.print_r().var_dump().printf()等,虽然对于有较丰富开发经验的程序员来说这些也已经足够了,他们往往可以在程序执行的过程中,通过输出特定变量的 ...
php 基于redis计数器类
本文引自网络 Redis是一个开源的使用ANSI C语言编写.支持网络.可基于内存亦可持久化的日志型.Key-Value数据库,并提供多种语言的API. 本文将使用其incr(自增),get(获取), ...
leetcode 460. LFU Cache
hash:存储的key.value.freq freq:存储的freq.key,也就是说出现1次的所有key在一起,用list连接 class LFUCache { public: LFUCache( ...

pandas 初识（一）

基本内容

Series:

Series 是有一组数据（numpy的数据类型 numpy.ndarray）以及一组数据标签（即索引）组成，可以看成一个一个定长的有序字典（索引值到数据值的一个映射）

DataFrame

pandas 初识（一）的更多相关文章

随机推荐

热门专题