求和 对每行或每列求和. 均值 对每行或每列求均值. 最大最小值 对每行或每列求最大值或最小值. 中位数 对每行或每列求中位数. 相关系数和协方差 先导入一个DataFram结构的数据,再对这些数据计算相关系数和协方差. 数值统计 计算某一列相同值出现的个数.可以排序,显示范围. 计数 统计某一列的值的个数.…
导入Pandas库 创建DataFrame结构 读取.csv文件 titanic_train.csv文件:https://files.cnblogs.com/files/gloria-zhang/titanic_train.rar pd.read_csv()返回DataFrame结构. 显示部分内容 数据信息 数据索引 没有指定的话会添加从0开始的索引. 列信息 每列数据类型 数据值 取指定的数据 指定索引列 根据索引获取数据 数据运算 备注:包括的运算有加.乘.求平均数.求最大值和最小值. 统…
Numpy 的基本能力之一是快速对每个元素进行运算 Pandas 继承了Numpy的功能,也实现了一些高效技巧. 对于1元运算,(函数,三角函数)保留索引和列标签 对于2元运算,(加法,乘法),Pandas 会自动对齐索引进行计算. 通用函数:保留索引 对ser对象或 df对象使用Numpy通用函数,生成的结果是另一个保留索引的Pandas对象. 通用函数: 索引对齐 当Series 或 DataFram对象进行二元计算,会对齐俩个对象的索引 当处理不完整的额数据时,这一点非常方便 Series…
Pandas库: pandas索引与计算:…
一.读取文件 1)读取文件内容 import pandas info = pandas.read_csv('1.csv',encoding='gbk') # 获取文件信息 print(info) print(type(info)) # 查看文件类型 print(info.dtypes) # 查看每列文件的类型 print(help(pandas.read_csv)) 2)获取文件的信息 import pandas info = pandas.read_csv('1.csv',encoding='…
1.读取数据 import pandas food_info = pandas.read_csv("food_info.csv") print(type(food_info)) # <class 'pandas.core.frame.DataFrame'> 2.数据类型 3.数据显示 food_info.head() # 显示读取数据的前5行 food_info.head(3) # 显示读取数据的前3行 food_info.tail(3) # 显示读取数据的后3行 food…
Series结构 筛选数据 指定值 备注:查找出指定数值的索引和数值. 逻辑运算 备注:查找出值大于2的数据. 复合索引 DataFrame结构 显示指定列 筛选显示 备注:值小于0的显示原值,否则显示空值. 备注:值小于0的显示原值,否则显示原值的负数. 备注:显示a<b的行. 备注:显示a<b且b<c的行.…
Series结构 索引 修改 旧数据赋值给新数据,旧数据不变. 对某一数值进行修改,可以选择保留修改前或修改后的数值. 替换索引 修改某一个索引 添加 在数据1后添加数据2,数据1不改变. 添加一个数据. 数据1后添加数据2,新生成的数据可以选择是否用原数据的索引. 删除 DataFrame结构 索引 修改 修改值 修改索引 添加 添加一行数据 两组DataFrame数据按行连接 两组DataFrame数据按列连接 删除 删除行 删除列…
字符串小写 字符串大写 字符串长度 去掉字符串中的空格 去掉字符串中的左空格 去掉字符串中的右空格 字符串替换 按字符串切割 字符串是否包含在另一个字符串中…
DataFrame结构排序 备注:group列降序,data列升序. 合并相同项 查找相同项 添加一列,值是其他列的值进行相关操作后的值 删除列 Series结构替换值 一组值按照范围归类 归类后每类的计数 设置每类的标签 DataFrame结构中空值操作 是否为空值 按行或列判断是否有空值 为空值填充指定值…