pandas函数应用】的更多相关文章

1,nan替换为0df = df(np.nan, 0, regex=True)2.inf替换为0df= df(np.inf, 0.0, regex=True)3.从数据库读取数据到dataframeinfo_detail = pd.read_sql(sql_detail+"'"+version+"'", pyodbc.connect(CONFIG_IN_LCD))4.从dataframe中取其中需要的几列info = info_detail.loc[:,['vers…
1.管道函数 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/5/24 15:03 # @Author : zhang chao # @File : s.py #pipe管道函数的应用 import pandas as pd import numpy as np def adder(ele1,ele2): return ele1+ele2 df = pd.DataFrame(np.random.randn(5,3),col…
本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入.数据清洗.预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作. 生成数据表 常见的生成数据表的方法有两种,第一种是导入外部数据,第二 种是直接写入数据.Excel中的"文件"菜单中提供了获取外部数据的功能,支持数据库和文本文件和页面的多种数据源导入. Python支持从多种类型的数据导入.在开始使用Python进行数据 导入前需要先导入pandas库,为了方便起见,我们也同时导入numpy…
一.处理丢失数据 有两种丢失数据: None np.nan(NaN) 1. None None是Python自带的,其类型为python object.因此,None不能参与到任何计算中. #查看None的数据类型 None + 1 2. np.nan(NaN) np.nan是浮点类型,能参与到计算中.但计算的结果总是NaN. #查看np.nan的数据类型 np.nan + 1 nan 3. pandas中的None与NaN 1) pandas中None与np.nan都视作np.nan 创建Da…
一.Pandas的数据结构 1.Series Series是一种类似与一维数组的对象,由下面两个部分组成: values:一组数据(ndarray类型) index:相关的数据索引标签 1)Series的创建 两种创建方式: (1) 由列表或numpy数组创建 默认索引为0到N-1的整数型索引 import pandas as pd from pandas import Series,DataFrame import numpy as np #使用列表创建Series Series(data=[…
Python:pandas(一) 这一章翻译总结自:pandas官方文档--General functions 空值:pd.NaT.np.nan //判断是否为空 if a is np.nan: ... 数据操作 melt 将DataFrame从一个宽类型转化为长类型:固定某一列,看该列变量其他列的值 pivot 用某些列将DataFrame变形(不是常见的大小变形) cut 切割一个一维数据为离散的区间 qcut 与cut相似,区别在于cut是等长切割,qcut是等元素数切割 merge 连接…
转载:https://blog.csdn.net/mvpboss1004/article/details/79188190 pandas中的get_dummies得到的one-hot编码数据类型是uint8,进行数值计算时会溢出!!! import pandas as pd import numpy as np a = [1, 2, 3, 1] one_hot = pd.get_dummies(a) print(one_hot.dtypes) print(one_hot) print(-one_…
1.pipe() :表格函数应用: 2.apply():表格行列函数应用: 3.applymap():表格元素应用.…
二.常用库 1.NumPy NumPy是高性能科学计算和数据分析的基础包.部分功能如下: ndarray, 具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组. 用于对整组数据进行快速运算的标准数学函数(无需编写循环). 用于读写磁盘数据的工具以及用于操作内存映射文件的工具. 线性代数.随机数生成以及傅里叶变换功能. 用于集成C.C++.Fortran等语言编写的代码的工具. 首先要导入numpy库:import numpy as np A NumPy函数和属性: 类型 类型代码 说明 i…
NumPy的ufuncs也可以操作pandas对象 >>> frame one two three four a 0 1 2 3 b 4 5 6 7 c 8 9 10 11 d 12 13 14 15 >>> np.square(frame)#求平方 one two three four a 0 1 4 9 b 16 25 36 49 c 64 81 100 121 d 144 169 196 225 >>> 用DataFrame的apply方法,可以…