pandas 新增数据列（直接赋值、apply，assign、分条件赋值）

# pandas新增数据列（直接赋值、apply、assign、分条件赋值）

# pandas在进行数据分析时，经常需要按照一定条件创建新的数据列，然后进行进一步分析

    # 1 直接赋值

    # 2 df.apply方法

    # 3 df.assig方法

    # 4 按条件选择分组分别赋值

import pandas as pd

# 0 读取csv数据到dataframe

df = pd.read_csv("beijing_tianqi_2018.csv")

print(df.head())

# 1 直接赋值的方法

# 实例：清理温度列，变成数字类型

# 替换掉温度的后缀

df.loc[:,'bWendu'] = df['bWendu'].str.replace("℃","").astype('int32')

df.loc[:,'yWendu'] = df['yWendu'].str.replace("℃","").astype('int32')

# 实例:计算温差

# 注意:df["bWendu"]其实是一个Series，后面的减法返回的是Series

df.loc[:,"wencha"] = df["bWendu"] - df["yWendu"]

print(df.head())

# 2 df.apply方法

# 实例：添加一列温度类型：

#  1 如果最高温度大于33度就是高温

#  2 如果最低温度低于-10度就是低温

#  3 否则就是常温

def get_wendu_type(x):

    if x["bWendu"] > 33:

        return "高温"

    if x["yWendu"] < -10:

        return "低温"

    else:

        return "常温"

# 注意需要设置axis ==1 ，这是series的index是columns

df.loc[:,"wendu_type"] = df.apply(get_wendu_type,axis=1)

# 查看温度类型的计数(高温、低温、常温各有多少天)

print(df["wendu_type"].value_counts())

# 3 df.assign方法

# 实例：将温度从摄氏度变成华氏度

# 可以同时添加多个新的列

df.assign(

    yWendu_huashi = lambda x : x['yWendu']*9/5 +32,

    bWendu_huashi = lambda x : x['bWendu']*9/5 +32

)

print(df['yWendu_huashi'])

# 4 按条件选择分组分别进行赋值

# 按条件选择数据，然后随这部分数据赋值新列

# 实例：高温温差大于10度，则认为温差大

# 先创建空列（这是第一种创建新列的方法）

df['wencha_type'] = ""

df.loc[df["bWendu"]-df["yWendu"] > 10,"wencha_type"] = "温差大"

df.loc[df["bWendu"]-df["yWendu"] <=10,"wencha_type"] = "温差正常"

df["wencha_type"].value_counts()

pandas 新增数据列（直接赋值、apply，assign、分条件赋值）的更多相关文章

5.pandas新增数据列
有的时候,表格自带的数据根本没有办法满足我们,我们经常会新加一列数据或者对原有的数据进行修改还是接着上篇文章的数据进行操作直接赋值我想算一下每一天的温差 df.loc[:, 'wencha'] ...
Pandas怎样新增数据列
Pandas怎样新增数据列? 在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析. 直接赋值 df.apply方法 df.assign方法按条件选择分组分别赋值 0.读取csv ...
Pandas常用操作 - 新增数据列
初始化测试数据 df = pd.DataFrame({'stu_name': ['Nancy', 'Tony', 'Tim', 'Jack', 'Lucy'], 'stu_age': [17, 16, ...
Layui数据表格/搜索重加载/分条件操作/工具条监听
<div class="layui-layout layui-layout-admin" style="padding-left: 20px;"> ...
【转载】C#如何往DataTable中新增一个数据列
在C#中的Datatable数据变量的操作过程中,有时候我们需要往现有的DataTable中新增一个自定义数据列,该列在原有的DataTable变量中并不存在,属于用户手工自定义新增的数据列,在往Da ...
Pandas中查看列中数据的种类及个数
Pandas中查看列中数据的种类及个数读取数据 import pandas as pd import numpy as np filepath = 'your_file_path.csv' data ...
【转载】使用Pandas创建数据透视表
使用Pandas创建数据透视表本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas创建数据透视表目录 pandas.pivot_table() 创建简单的数据透视表增加一个行维度(inde ...
pandas学习(数据分组与分组运算、离散化处理、数据合并)
pandas学习(数据分组与分组运算.离散化处理.数据合并) 目录数据分组与分组运算离散化处理数据合并数据分组与分组运算 GroupBy技术:实现数据的分组,和分组运算,作用类似于数据透视表 ...
Pandas DataFrame数据的增、删、改、查
Pandas DataFrame数据的增.删.改.查 https://blog.csdn.net/zhangchuang601/article/details/79583551 #删除列 df_2 = ...

随机推荐

SQL读取表中不重复字段
通关关键字 distinct 将AlbumName字段中所以不重复的内容读出来.
ES的聚合操作
构建数据: @Test public void createIndex(){ /** * 创建索引 * */ client. ...
React 进阶设计与控制权问题
控制权--这个概念在编程中至关重要.比如,"轮子"封装层与业务消费层对于控制权的"争夺",就是一个很有意思的话题.这在 React 世界里也不例外.表面上看,我 ...
vue 使用props 实现父组件向子组件传数据
刚自学vue不久遇到很多问题,刚好用到的分组件,所以就用到传递数据弄了好久终于搞定了,不多说直接上代码父组件: <template> <headers :inputName=&q ...
关于openGL、GPUImage、ios直播相关不错的博客
http://www.jianshu.com/users/815d10a4bdce/latest_articles
Non-local Neural Networks
1. 摘要卷积和循环神经网络中的操作都是一次处理一个局部邻域,在这篇文章中,作者提出了一个非局部的操作来作为捕获远程依赖的通用模块. 受计算机视觉中经典的非局部均值方法启发,我们的非局部操作计算某一 ...
Exchanger 源码分析
Exchanger 此类提供对外的操作是同步的: 用于成对出现的线程之间交换数据[主场景]: 可以视作双向的同步队列: 可应用于基因算法.流水线设计.数据校对等场景创建实例 /** * arena ...
javascript 动态修改css样式方法汇总(四种方法)
在很多情况下,都需要对网页上元素的样式进行动态的修改.在JavaScript中提供几种方式动态的修改样式,下面将介绍方法的使用.效果.以及缺陷. 1.使用obj.className来修改样式表的类名. ...
005-unity3d 添加背景音乐、音效以及天空盒子
一.基础知识 1.项目中需要有AudioListener,播放器中播放的声音就是AudioListener组件坐在的位置听到的声音.默认AudioListener是放到Main Camera上.没有A ...
Maven的一些常用命令
将本项目的源码部署到本地仓库 mvn clean source:jar install 将本地jar包部署到本地仓库,首先将jar包放在当前目录下,然后执行,这样做比直接把jar包copy到本地仓库更 ...

pandas 新增数据列（直接赋值、apply，assign、分条件赋值）

pandas 新增数据列（直接赋值、apply，assign、分条件赋值）的更多相关文章

随机推荐

热门专题