Numpy
一 : 安装ipython以及用到的包介绍
# 这里我们会用到ipython解释器,本文代码在ipython下运行
Pip3 install ipython
Pip3 install jupyter
Jupyter notebook
Pandas 是我们数据分析的核心包
pandas相当于是表数据
Series相当于表数据的一列
Dropna() : 过滤掉为nan的行
iloc 是下标 df[0,1] # 两个都是下标
Loc 是标签 df.loc[df.index[0], 'close'] # 两个都是标签
#例子中是知道一个索引,将索引变成标签
多维:
- Df.dropna(how='all') 删除单列全是nan的
- Df.dropna(axis=1) #x=1找行 , x=1找列
二: 关于numpy
import numpy as np
# astype
In [7]:
arr = np.array([1.2,2.3,3.4])
arr.astype('int')
arr
arr1 = arr.astype('int')
arr1
Out[7]:
array([1, 2, 3])
In [ ]:
# eye 矩阵
In [12]:
np.eye(6)
Out[12]:
array([[ 1., 0., 0., 0., 0., 0.],
[ 0., 1., 0., 0., 0., 0.],
[ 0., 0., 1., 0., 0., 0.],
[ 0., 0., 0., 1., 0., 0.],
[ 0., 0., 0., 0., 1., 0.],
[ 0., 0., 0., 0., 0., 1.]])
In [14]:
import random
l = [random.randint(1,10) for i in range(0,20)]
l
Out[14]:
[2, 6, 3, 5, 1, 5, 7, 5, 10, 7, 2, 7, 4, 8, 2, 2, 3, 1, 5, 2]
In [17]:
arr = np.array(l)
arr
Out[17]:
array([ 2, 6, 3, 5, 1, 5, 7, 5, 10, 7, 2, 7, 4, 8, 2, 2, 3,
1, 5, 2])
In [18]:
list(filter(lambda x:x>5,l))
Out[18]:
[6, 7, 10, 7, 7, 8]
In [19]:
arr.T
Out[19]:
array([ 2, 6, 3, 5, 1, 5, 7, 5, 10, 7, 2, 7, 4, 8, 2, 2, 3,
1, 5, 2])
In [20]:
arr.size
Out[20]:
20
In [21]:
arr.ndim
Out[21]:
1
In [30]:
arr=np.array([1.2,2.3,3.8,5,6])
arr
Out[30]:
array([ 1.2, 2.3, 3.8, 5. , 6. ])
In [31]:
arr.astype('int')
Out[31]:
array([1, 2, 3, 5, 6])
In [34]:
# 花式索引
arr = np.array(l)
arr
Out[34]:
array([ 2, 6, 3, 5, 1, 5, 7, 5, 10, 7, 2, 7, 4, 8, 2, 2, 3,
1, 5, 2])
In [36]:
# 花式索引
arr[[1,3,5,7,9]]
Out[36]:
array([6, 5, 5, 5, 7])
In [37]:
# 花式索引
arr[np.arange(0,arr.size,2)]
Out[37]:
array([ 2, 3, 1, 7, 10, 2, 4, 2, 3, 5])
In [45]:
'''
ceil : 向上取整 3.1-->4 -3.1 --> -3
floor : 向下取整 取小 3.1-->3 3.9-->3
rint(round) : 四舍五入 3.6--> 4 3.1-->3 找最近的数
trunc(int) : 向零取整(舍去小数点后)
modf : 将整数和小数分开
maximun 相同位置取最大
minimum 相反
'''
arr = np.arange(10)
arr.sum()
arr.mean() # 平均数
arr.cumsum() # 前缀和
Out[45]:
array([ 0, 1, 3, 6, 10, 15, 21, 28, 36, 45])
In [43]:
# var : 方差, 表示这组输的离散程度
arr.var() 数越小越集中
Out[43]:
8.25
In [44]:
# std : 标准差
arr.std()
Out[44]:
2.8722813232690143
# uniform : 对应randint 小数
# np.random.rand() 0到1 的随机小数
In [47]:
l = [1,2,3,4,5]
random.shuffle(l) # 洗牌
l
Out[47]:
[5, 3, 4, 1, 2]
np.random.randint(-10,10,5) # -10到10之间的随机整数 拿5个
In [*]:
np.random.randint(-10,10,(3,5)) # -10到10之间的随机整数 拿5个
Numpy的更多相关文章
- 《机器学习实战-KNN》—如何在cmd命令提示符下运行numpy和matplotlib
问题背景:好吧,文章标题是瞎取得.平常用cmd运行python代码问题不大,我在学习<机器学习实战>这本书时,发现cmd无法运行import numpy as np以及import mat ...
- 机器学习实战笔记(Python实现)-08-线性回归
--------------------------------------------------------------------------------------- 本系列文章为<机器 ...
- 机器学习实战笔记(Python实现)-04-Logistic回归
--------------------------------------------------------------------------------------- 本系列文章为<机器 ...
- 机器学习实战笔记(Python实现)-03-朴素贝叶斯
--------------------------------------------------------------------------------------- 本系列文章为<机器 ...
- 机器学习实战笔记(Python实现)-01-K近邻算法(KNN)
--------------------------------------------------------------------------------------- 本系列文章为<机器 ...
- 《机器学习实战》学习笔记——第13章 PCA
1. 降维技术 1.1 降维的必要性 1. 多重共线性--预测变量之间相互关联.多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯.2. 高维空间本身具有稀疏性.一维正态分布有68%的值落于正负 ...
- 机器学习实战 - 读书笔记(14) - 利用SVD简化数据
前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第14章 - 利用SVD简化数据. 这里介绍,机器学习中的降维技术,可简化样品数据. 基 ...
- 机器学习实战 - 读书笔记(13) - 利用PCA来简化数据
前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第13章 - 利用PCA来简化数据. 这里介绍,机器学习中的降维技术,可简化样品数据. ...
- 机器学习实战笔记5(logistic回归)
1:简单概念描写叙述 如果如今有一些数据点,我们用一条直线对这些点进行拟合(改线称为最佳拟合直线),这个拟合过程就称为回归.训练分类器就是为了寻找最佳拟合參数,使用的是最优化算法. 基于sigmoid ...
- K近邻 Python实现 机器学习实战(Machine Learning in Action)
算法原理 K近邻是机器学习中常见的分类方法之间,也是相对最简单的一种分类方法,属于监督学习范畴.其实K近邻并没有显式的学习过程,它的学习过程就是测试过程.K近邻思想很简单:先给你一个训练数据集D,包括 ...
随机推荐
- 天天乐宝APP开发
"互联网+"时代是一个"信息过剩"的时代,也是一个"注意力稀缺"的时代,怎样在"无限的信息中"获取"有限的注意 ...
- 05.haproxy+mysql负载均衡 整合 redis集群+ssm
本篇重点讲解haproxy+mysql负载均衡,搭建完成后与之前搭建的redis+ssm进行整合 (注:这里用到了两台mysql数据库,分别安装两台虚拟机上,已经成功实现主主复制,如果有需要,请查看我 ...
- 大数据学习(1)Hadoop安装
集群架构 Hadoop的安装其实就是HDFS和YARN集群的配置,从下面的架构图可以看出,HDFS的每一个DataNode都需要配置NameNode的位置.同理YARN中的每一个NodeManager ...
- CS Round#49 C Max Substring
Max Substring Time limit: 1000 msMemory limit: 256 MB You are given a string S. Find a string T th ...
- iOS旋钮动画-CircleKnob
欢迎相同喜欢动效的project师/UI设计师/产品添加我们 iOS动效特攻队–>QQ群:547897182 iOS动效特攻队–>熊熊:648070256 前段时间和群里的一个设计师配合. ...
- 使用storyboard设置button边框属性(颜色,宽度,圆角)
通常使用Category时.仅仅能加入方法,不可加入属性.可是在使用Storyboard时我们可能会使用到keyPath,这里设置的key都须要是所设置视图的属性值.而且类型有所限制. 比如:我如今有 ...
- JS 循环遍历JSON数据 分类: JS技术 JS JQuery 2010-12-01 13:56 43646人阅读 评论(5) 收藏 举报 jsonc JSON数据如:{"options":"[{
JS 循环遍历JSON数据 分类: JS技术 JS JQuery2010-12-01 13:56 43646人阅读 评论(5) 收藏 举报 jsonc JSON数据如:{"options&q ...
- Linux网络编程--wireshark分析TCP包头的格式
摘要: 本文简介了TCP面向连接理论知识,具体讲述了TCP报文各个字段含义.并从Wireshark俘获分组中选取TCP连接建立相关报文段进行分析. 一.概述 TCP是面向连接的可靠传输 ...
- Java深入 - MyBatis的经常用法
MyBatis我们这篇文章主要记录一些经常使用的操作方法.这样在开发和使用的过程中这篇文章能够当做工具书来使用. MyBatis的数据源配置 <bean id="dataSource& ...
- 苹果新的编程语言 Swift 语言进阶(三)--基本运算和扩展运算
一 基本操作运算 1. 赋值操作 在Swift 中,能够使用赋值操作为一个常量或一个变量赋值,也能够使用多元组一次为多个常量或变量赋值. Swift 的赋值操作与其他语言最大的不同是赋值操作除了可以为 ...