Python中dataframe\ array\ list相互转化】的更多相关文章

import pandas as pd import numpy as np #创建列表 a1=[1,2,3] #arange函数:指定初始值.终值.步长来创建数组 a2=np.arange(0,1,0.1) #创建数据框 a3=pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]}) #1.list 转化成array矩阵 b1 = np.array(a1).T Out[30]: array([1, 2, 3]) #2.array转化成datafra…
python中的str对象其实就是"8-bit string" ,字节字符串,本质上类似java中的byte[]. 而python中的unicode对象应该才是等同于java中的String对象,或本质上是java的char[]. str: s = "你好" unicode: u = u"你好“ unicode转化为str,采用encode 编码: str = u.encode('gbk') str转化为unicode ,采用decode 解码: unic…
官网文档的例子 from multiprocessing import Process, Value, Array def f(n, a): n.value = 3.1415927 for i in range(len(a)): a[i] = -a[i] if __name__ == '__main__': num = Value('d', 0.0) arr = Array('i', range(10)) p = Process(target=f, args=(num, arr)) p.star…
简介 numpy 创建的数组都有一个shape属性,它是一个元组,返回各个维度的维数.有时候我们可能需要知道某一维的特定维数. 二维情况 >>> import numpy as np >>> y = np.array([[1,2,3],[4,5,6]]) >>> print(y) [[1 2 3] [4 5 6]] >>> print(y.shape) (2, 3) >>> print(y.shape[0]) 2 &…
df = pd.merge( df, # 左 wzplbm, # 右 left_on = ['WZBM','ZBWZMC'], # 左DataFrame匹配列 right_on = ['WZPLBM','WZMC'],# 右DataFrame匹配列 how='inner' # 内连接 (left:左连接,right:右连接,outer:外连接) )…
利用pandas自带的函数notnull可以很容易判断某一列是否为null类型,但是如果这一列中某一格为空字符串"",此时notnull函数会返回True,而一般我们选择非空行并不包括这一点,所以需要把这一类也去掉. # df为需要筛选的数据框,col为选择非空依赖的列 df = df[(df[col].notnull) & (df[col] != "")] 如果数据来源是MySQL数据库,用sql函数调用的时候也要注意相同的问题. SELECT col F…
# 去除重复行数据 keep:'first':保留重复行的第一行,'last':保留重复行的最后一行,False:删除所有重复行df = df.drop_duplicates( subset=['YJML','EJML','SJML','WZLB','GGXHPZ','CGMS'], # 去重列,按这些列进行去重 keep='first' # 保存第一条重复数据 )…
# 识别python中DataFrame中的nanfor i in pfsj.index: if type(pfsj.loc[i]['WZML']) == float: print('float value is ${}'.format(pfsj.loc[i]['WZML'])) elif type(pfsj.loc[i]['WZML']) == str: print('str value is ${}'.format(pfsj.loc[i]['WZML'])) 结果: # 根据结果可知在Dat…
python中的axis究竟是如何定义的呢?他们究竟代表是DataFrame的行还是列? 直接上代码people=DataFrame(np.random.randn(5,5), columns=['a','b','c','d','e'], index=['Joe','Steve','Wes','Jim','Travis'])               a         b         c         d         eJoe     0.814300 -0.495764  0.3…
关于python中的矩阵乘法,我们一般有两种数据格式可以实现:np.array()类型和np.mat()类型: 对于这两种数据类型均有三种操作方式: (1)乘号 * (2)np.dot() (3)np.multiply() 而这三种操作方式在操作这两种数据格式时又有点区别,下面一一列出来: import numpy as np #np.array() type #1. np.dot() a = np.array([[1 , 2] , [3 , 4]] , dtype = np.float) b…