摘要:关于numpy and pandas的使用很多,最近也老用到,但是作为初学者总是模模糊糊,使用不清楚,所以就好好总结了一下,以备后用

第一部分:numpy

1、基础属性

  import numpy as np
  array = np.array([ [1,2,3] ,[2,3,4] ])
  print(array)
  print(array.ndim,'\t',array.shape,'\t',array.size) #维数,矩阵行列数,元素个数

  

  2、创建

  a = np.array( [   ]  ,dtype = np.int)

     a= np.zeros((2,3))     #创建两行三列的全0矩阵

  

    a = np.ones( (3,4),dtype = np.int )   #创建三行四列的全1矩阵

    

   a = np.arange(10,20,2)    #创建10-20,步长为2的矩阵

  

     a = np.arange(12).reshape( (3,4))    

    

     a = np.linspace(1,10,20).reshape( (4,5) )    #创建1-10,20个元素的等差数列矩阵

    

  3、运算

    a = np.array( [10,20,30,40] )
    b = np.arange( 4 )
    print('a = ',a,'\n','b = ', b)
    print('a+b =',a + b)
    print('b**2 =',b**2)
    print('10*np.sin(a)=',10*np.sin(a))
    print('b<3 = ',b < 3)

    

    a = np.random.random( (2,4) )
    print(a)
    print(np.sum(a))
    print(np.min(a)) #最小值
    print(np.max(a)) #最大值
    print(np.sum(a,axis = 1)) #行求和
    print(np.sum(a,axis = 0)) #列求和

    

    A = np.arange(2,14).reshape((3,4))
    print(A)
    print(np.argmin(A)) #A中最小值的index
    print(np.argmax(A)) #A中最大值的index
    print(np.mean(A)) #A的平均值
    print(np.average(A)) #A的平均值
    print(A.mean()) #A的平均值
    print(np.median(A)) #A的中位数
    print(np.cumsum(A)) #A的累加
    print(np.diff(A)) #A的累差

    

    A = np.arange(-2,10).reshape((3,4))
    print(A)
    print(np.nonzero(A)) #非0元素的行列号
    print(np.sort(A)) #A排序,从小到大
    print(np.transpose(A)) #A的转置
    print(A.T) #A的转置
    print(np.clip(A,5,9)) #A中小于5的改为5,大于9的改为9
    print(np.mean(A,axis = 0)) #A中按列求平均值
    print(np.mean(A,axis = 1)) #A中按行求平均值

    

  4、索引  

    A = np.arange(,).reshape( (,) )
    print(A)
    print(A[])
    print(A[][])
    print(A[,])

    

    A = np.arange(3,15).reshape( (3,4) )
    print(A)
    print(A[2,:]) #第二行所有数
    print(A[:,1]) #第一列所有数
    print(A[1,1:2]) #第一行,第一列到第二列的数

    

    for row in A:       #A按行遍历
     print(row)
    for column in A.T: #A转置后按行遍历
     print(column)
    for item in A.flat: 迭代A的每一项
     print(item)

    

  5、合并

    A = np.array([1,1,1],)
    B = np.array([2,2,2])
    print(np.vstack( (A,B) )) #行合并
    print(np.hstack( (A,B) )) #列合并
    print(A[np.newaxis,:])
    print(A[:,np.newaxis])
    print(np.concatenate( (A,B,B,A) ,axis = 0 ) )

    

  6、分割

    A = np.arange(12).reshape((3,4))
    print(np.split(A,2,axis = 1)) #列分2块
    print(np.split(A,3,axis = 0)) #行分3块
    #print(np.split(A,3,axis = 1)) #不能进行不均等分割

    

    print(np.array_split(A,3,axis = 1))     #进行不均等分割

    

    print(np.vsplit(A,3))       #行分
    print(np.hsplit(A,2)) #列分

    






关于numpy的更多相关文章

  1. 利用Python进行数据分析(5) NumPy基础: ndarray索引和切片

    概念理解 索引即通过一个无符号整数值获取数组里的值. 切片即对数组里某个片段的描述. 一维数组 一维数组的索引 一维数组的索引和Python列表的功能类似: 一维数组的切片 一维数组的切片语法格式为a ...

  2. 利用Python进行数据分析(4) NumPy基础: ndarray简单介绍

    一.NumPy 是什么 NumPy 是 Python 科学计算的基础包,它专为进行严格的数字处理而产生.在之前的随笔里已有更加详细的介绍,这里不再赘述. 利用 Python 进行数据分析(一)简单介绍 ...

  3. 利用Python进行数据分析(6) NumPy基础: 矢量计算

    矢量化指的是用数组表达式代替循环来操作数组里的每个元素. NumPy提供的通用函数(既ufunc函数)是一种对ndarray中的数据进行元素级别运算的函数. 例如,square函数计算各元素的平方,r ...

  4. python安装numpy、scipy和matplotlib等whl包的方法

    最近装了python和PyCharm开发环境,但是在安装numpy和matplotlib等包时出现了问题,现总结一下在windows平台下的安装方法. 由于现在找不到了工具包新版本的exe文件,所以采 ...

  5. 深入理解numpy

    一.为啥需要numpy python虽然说注重优雅简洁,但它终究是需要考虑效率的.别说运行速度不是瓶颈,在科学计算中运行速度就是瓶颈. python的列表,跟java一样,其实只是一维列表.一维列表相 ...

  6. Python Numpy,Pandas基础笔记

    Numpy Numpy是python的一个库.支持维度数组与矩阵计算并提供大量的数学函数库. arr = np.array([[1.2,1.3,1.4],[1.5,1.6,1.7]])#创建ndarr ...

  7. broadcasting Theano vs. Numpy

    broadcasting Theano vs. Numpy broadcast mechanism allows a scalar may be added to a matrix, a vector ...

  8. python之numpy

    一.矩阵的拼接合并 列拼接:np.column_stack() >>> import numpy as np >>> a = np.arange(9).reshap ...

  9. win7系统下python安装numpy,matplotlib,scipy和scikit-learn

    1.安装numpy,matplotlib,scipy和scikit-learn win7系统下直接采用pip或者下载源文件进行安装numpy,matplotlib,scipy时会遇到各种问题,这是因为 ...

  10. 给numpy矩阵添加一列

    问题的定义: 首先我们有一个数据是一个mn的numpy矩阵现在我们希望能够进行给他加上一列变成一个m(n+1)的矩阵 import numpy as np a = np.array([[1,2,3], ...

随机推荐

  1. P4715 「英语」Z 语言

    题解: 平衡树维护hash值 为了支持加入删除操作 x*base^y 其中y为他是第k大 同一般的维护方法,我们不用对每个节点维护他的hash值 而是只用记录他的x值(他的位置) 然后通过updata ...

  2. 【ASP.NET】UCenter实现多站点同步注册

    问题描述 上一篇文章写了[ASP.Net]UCenter实现多站点同步登录退出 在整合论坛的时候,同步注册也是相当必要的一个功能:将论坛注册的用户同步到自己的网站,自己网站注册的用户同步到论坛. 官方 ...

  3. 【Android】android:windowSoftInputMode属性详解

    activity主窗口与软键盘的交互模式,可以用来避免输入法面板遮挡问题,Android1.5后的一个新特性. 这个属性能影响两件事情: [一]当有焦点产生时,软键盘是隐藏还是显示 [二]是否减少活动 ...

  4. 【转】如何向Android模拟器打电话发短信

    转载地址:http://hi.baidu.com/jeremylai/item/420f9c9fe4881fccb62531f7 1. 启动Android Emulator, 查看标题栏找出端口.一般 ...

  5. Mongodb查询提示com.MongoDB.MongoException: too much data for sort() with no index

    解决办法: 查询数据量太大,添加索引即可解决问题 通过scrapy爬行完数据后,通过db.wooyun.drops.ensureIndex({"datetime":1})

  6. 卸载impala

    1):删除impala rm -rf $(find / -name "*impala*") 2):卸载impala相关依赖 rm -rf $(find / -name " ...

  7. python3改版后的特征

    1.原始数据类型和运算符 # 整数 3 # => 3 # 算术没有什么出乎意料的 1 + 1 # => 2 8 - 1 # => 7 10 * 2 # => 20 # 但是除法 ...

  8. Codeforces 1092E Minimal Diameter Forest

    Minimal Diameter Forest 首先我们找出每个连通块中的特殊点, 特殊点的定义是到各种个连通块中距离的最大值最小的点, 每个连通块肯定通过特殊点连到其他连通块, 我们把有最大值的特殊 ...

  9. linux中查看http各种状态数量

    转自: http://www.cnblogs.com/wayne173/p/5652043.html 我们的网站部署在linux的服务器上,特别是web服务器,我们可能有时候做为运维人员,肯定是要查看 ...

  10. OpenJ_Bailian 4017 爬楼梯

    时间限制: 1000 ms  空间限制: 262144 KB 题目描述 树老师爬楼梯,他可以每次走1级或者2级,输入楼梯的级数,求不同的走法数.例如:楼梯一共有3级,他可以每次都走一级,或者第一次走一 ...