Python练习:初别Pandas
# Pandas安装
- Anaconda 安装: conda install pandas 或者pip install pandas 参考 http://pandas.pydata.org/
## Series 示例
- 定义方式如下
>>>s1 = Series(['张三','男',25,'北京'])
>>>print(s1)
0 张三
1 男
2 25
3 北京
dtype: object
- 带索引定义
>>>s2 = Series(['张三','男',25,'北京'],index=['Name','Sex','Age','Addr'])
>>>s3 = Series(['张三','男',25,'北京'],['Name','Sex','Age','Addr'])
>>>print(s2)
Name 张三
Sex 男
Age 25
Addr 北京
dtype: object
>>>print(s3)
Name 张三
Sex 男
Age 25
Addr 北京
dtype: object
- 传入字典方式
>>>dic = {'Name':'张三','Sex':'男','Age':25,'Addr':'北京'}
>>> s4 = Series(dic)
>>>print(s4)
Name 张三
Sex 男
Age 25
Addr 北京
dtype: object
- 访问索引和值
>>>s4.index
Index(['Nmae', 'Sex', 'Age', 'Addr'], dtype='object')
>>>s4.values
array(['张三', '男', 25, '北京'], dtype=object)
>>>s4.index
Index(['Name', 'Sex', 'Age', 'Addr'], dtype='object')
>>>
>>>s4.values
array(['张三', '男', 25, '北京'], dtype=object)
## DataFrame
- DataFrame 是一种二维的数据结构,非常接近于电子表格或者类似 mysql 数据库的形式。它的竖行称之为 columns,横行跟前面的 Series 一样,称之为 index,也就是说可以通过 columns 和 index 来确定一个主句的位置。
- 示例
>>>data = {'年级':['一年级','二年级','三年级'], '班数':[10, 8, 8 ], '主任':['张老师', '李老师', '王老师']}
>>>Df = DataFrame(data)
>>>print(Df)
年级 班数 主任
0 一年级 10 张老师
1 二年级 8 李老师
2 三年级 8 王老师
>>>Df2= DataFrame(data, index=['a', 'b', 'c'])
>>>print(Df2)
年级 班数 主任
a 一年级 10 张老师
b 二年级 8 李老师
c 三年级 8 王老师
>>>
>>>Df['年级']
0 一年级
1 二年级
2 三年级
Name: 年级, dtype: object
>>>Df['班数'][0] = 9
>>>print(Df)
年级 班数 主任
0 一年级 9 张老师
1 二年级 10 李老师
2 三年级 10 王老师
>>>Df['班数'][1] = 11
>>>print(Df)
年级 班数 主任
0 一年级 9 张老师
1 二年级 11 李老师
2 三年级 10 王老师
>>>Df['班数'] = 11
>>>print(Df)
年级 班数 主任
0 一年级 11 张老师
1 二年级 11 李老师
2 三年级 11 王老师
>>>
Python练习:初别Pandas的更多相关文章
- python及numpy,pandas易混淆的点
https://blog.csdn.net/happyhorizion/article/details/77894035 初接触python觉得及其友好(类似matlab),尤其是一些令人拍案叫绝不可 ...
- 利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
- 利用Python进行数据分析(9) pandas基础: 汇总统计和计算
pandas 对象拥有一些常用的数学和统计方法. 例如,sum() 方法,进行列小计: sum() 方法传入 axis=1 指定为横向汇总,即行小计: idxmax() 获取最大值对应的索 ...
- 利用Python进行数据分析(8) pandas基础: Series和DataFrame的基本操作
一.reindex() 方法:重新索引 针对 Series 重新索引指的是根据index参数重新进行排序. 如果传入的索引值在数据里不存在,则不会报错,而是添加缺失值的新行. 不想用缺失值,可以用 ...
- 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍
一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...
- python安装numpy和pandas
最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须 ...
- [转] python安装numpy和pandas
最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网遇到了很多问题就记下来了.首要条件,python版本必须 ...
- Python数据分析入门之pandas基础总结
Pandas--"大熊猫"基础 Series Series: pandas的长枪(数据表中的一列或一行,观测向量,一维数组...) Series1 = pd.Series(np.r ...
- 【转载】python安装numpy和pandas
转载:原文地址 http://www.cnblogs.com/lxmhhy/p/6029465.html 最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装 ...
随机推荐
- Python学习之MySQLdb模块
摘要: MySQLdb模块用于操作mysql数据库.1.安装MySQLdb模块 yum install MySQL-python -y2.操作流程①.导入模块: import MySQLdb②.连接数 ...
- 机器学习——KNN
导入类库 import numpy as np from sklearn.neighbors import KNeighborsClassifier from sklearn.model_select ...
- [LeetCode] Rabbits in Forest 森林里的兔子
In a forest, each rabbit has some color. Some subset of rabbits (possibly all of them) tell you how ...
- java保留小数后两位的四种写法
package com.btzh.mis.house.utils; import java.math.BigDecimal;import java.math.RoundingMode;import j ...
- 文献阅读方法 & 如何阅读英文文献 - 施一公(转)
附: 如何看懂英文文献?(好) 看需求,分层次 如何总结和整理学术文献? Mendeley & Everything 如何在pdf文献上做笔记?福晰阅读器 自己感悟: 一篇专业文献通常会有几页 ...
- JMM(java Memory Model)到底是什么?
经历过很多面试大部分都会问一句: 你知道Java内存模型么? 然后我就pulapula的说一大堆什么堆呀,栈呀,GC呀什么的,这段时间把JVM虚拟机和多线程编程完整的学习了一遍,发现JMM和堆/栈这 ...
- 壁虎书3 Classification
MNIST fetch_openml returns the unsorted MNIST dataset, whereas fetch_mldata() returned the dataset s ...
- linux上创建svn服务器(centos7.3)
1.安装svn yum -y install subversion 2.创建svn版本仓库 mkdir /var/svn/svnrepos svnadmin create /var/svn/svnre ...
- 多线程之Lock的基本介绍
基本介绍 java.util.concurrent.locks是java1.5之后出现的一种锁实现方式,是一个接口.但是在这之前已经有一个同步机制的实现就是synchronized关键字,那为什么还要 ...
- Elasticsearch学习笔记(七)document小结
一.生成document id 1.自动生成document id 自动生成的id,长度为20个字符,URL安全,base64编码,GUID,分布式系统并行生成时不可能 ...