numpy+pandas 基础学习
#-*- coding:utf-8 -*-
import numpy as np; data1=[1,2,3,4,5]
array1=np.array(data1) #创建数组/矩阵
# 使用numpy中的array函数
data2=[[1,3,4],[2,5,6]]
array2=np.array(data2) #查看变量的数据类型:dtype
array2.dtype #转换数据格式 astype
array2_str=array2.astype('str')
array2_str.dtype ## pandas 有两个数据结构:Series和 DataFrame
## Series类似一维数组,和array很像,由一组数据和数据标签(类似索引)组成
## Series 能自动对齐索引,如果对不上,会NaN表示缺失
import pandas as pd;
s=pd.Series([1,2,3,4]);
s1=pd.Series([1,2,3,4],index=['a','b','c','d'])
s.index
s[1]
s[[1,2]] #字典
d={'qiulu':'handsome',
'lulu':'graceful'
}
s2=pd.Series(d) ## DataFrame是一个表格型的数据结构,类似一张excel表格或者SQL
##最常用的构建DataFrame的方法是:传入一个字典
dict={
'name':['张三','李四','王五','赵六'],
'sex':['男','男','男','女'],
'age':[18,19,20,21]
} df=pd.DataFrame(dict) df.info() ## 查看数据类型
df.age.astype('str')
df['age'] df['age']=[19,20,21,22]
df['country']='china' # DataFrame查询会特别方便
df[df.age==20]
df[(df.age>=20) & (df.sex=='男')] # query 可以类似SQL的查询方式
df.query('(age>18 and sex=="男") or (age<21 and sex=="女")') df1=pd.DataFrame(np.arange(4).reshape(2,2),columns=['a','b'])
df2=pd.DataFrame(np.arange(12).reshape(2,6),columns=['a','b','c','d','e','f']) ## iloc 序号
## loc 标签
## ix 行+列,序号标签都行
numpy+pandas 基础学习的更多相关文章
- Pandas基础学习与Spark Python初探
摘要:pandas是一个强大的Python数据分析工具包,pandas的两个主要数据结构Series(一维)和DataFrame(二维)处理了金融,统计,社会中的绝大多数典型用例科学,以及许多工程领域 ...
- numpy&pandas基础
numpy基础 import numpy as np 定义array In [156]: np.ones(3) Out[156]: array([1., 1., 1.]) In [157]: np.o ...
- pandas基础学习一
生成对象 用值列表生成 Series 时,Pandas 默认自动生成整数索引: In [3]: s = pd.Series([1, 3, 5, np.nan, 6, 8]) In [4]: s Out ...
- Python Numpy,Pandas基础笔记
Numpy Numpy是python的一个库.支持维度数组与矩阵计算并提供大量的数学函数库. arr = np.array([[1.2,1.3,1.4],[1.5,1.6,1.7]])#创建ndarr ...
- #2 numpy pandas初步学习记录
对numpy中的array进行了了解,array方法的取值arr_2d[0:2, 0:2] pandas 1,read_CSV方法 2,head方法 3,loc方法,取值前开后开, 4,replace ...
- 18-09-21 numpy 的基础学习01
# 1关于numpy 的学习import numpy as np # 一 如何创建数组****# 1 有规律的一维数据的创建======# 1 range() 和arange() 区别 貌似没有区别l ...
- pandas基础学习
1.导入两个数据分析重要的模块import numpy as npimport pandas as pd2.创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值dat ...
- Pandas 基础学习
加载数据 Fun:pandas.read_csv >>> import pandas >>> food_info = pandas.read_csv("f ...
- Python 读取UCI iris数据集分析、numpy基础学习
python基础.numpy使用.io读取数据集.数据处理转换与简单分析.读取UCI iris数据集中鸢尾花的萼片.花瓣长度数据,进行数据清理,去重,排序,并求出和.累积和.均值.标准差.方差.最大值 ...
随机推荐
- js的命名空间 && 单体模式 && 变量深拷贝和浅拷贝 && 页面弹窗设计
说在前面:这是我近期开发或者看书遇到的一些点,觉得还是蛮重要的. 一.为你的 JavaScript 对象提供命名空间 <!DOCTYPE html> <html> <he ...
- PHP localhost和127.0.0.1 的区别
- Problem 1 :nslookup,dig,host及网络相关命令
网络基础命令 [root@localhost sysconfig]# netstat -rn Kernel IP routing table Destination Gateway Genmask F ...
- DS二叉树--Huffman编码与解码
题目描述 1.问题描述 给定n个字符及其对应的权值,构造Huffman树,并进行huffman编码和译(解)码. 构造Huffman树时,要求左子树根的权值小于.等于右子树根的权值. 进行Huffma ...
- zzzp0371 属于本人
所有关于zzzp0371账号,属于本人 如有问题,请在此留言联系我
- ALGO-11_蓝桥杯_算法训练_瓷砖铺放(递归)
问题描述 有一长度为N(<=N<=)的地板,给定两种不同瓷砖:一种长度为1,另一种长度为2,数目不限.要将这个长度为N的地板铺满,一共有多少种不同的铺法? 例如,长度为4的地面一共有如下5 ...
- Android 引用库项目,Debug 库项目
转自:http://www.cnblogs.com/xitang/p/3615768.html#commentform 使用引用项目,无法追到源代码,无法Debug库项目The JAR of this ...
- Kubernetes1.8以后kubelet连接api-server问题
Kubernetes1.8以后版本,kubelet命令去掉--api-servers选项,参考官方kubelet 1.8 --kubeconfig string Path to a kubeconfi ...
- PAT 乙级 1041 考试座位号(15) C++版
1041. 考试座位号(15) 时间限制 400 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 CHEN, Yue 每个PAT考生在参加考试时都会被分 ...
- 开发框架-Web-Java:JeePlus
ylbtech-开发框架-Web-Java:JeePlus 1.返回顶部 2.返回顶部 3.返回顶部 4.返回顶部 5.返回顶部 0. http://www.jeeplus.org/ ...