pandas处理字符串
# pandas 字符串的处理
# 前面已经学习了字符串的处理函数
# df["bWendu"].str.replace("℃","").astype(int32) # pandas的字符串处理
# 1 : 使用方法:先获取seriea的str属性,然后在属性上调用函数
# 2 : 只能在字符串列上使用,不能在数字列上使用
# 3 : DataFrame上没有str属性和处理方法
# 4 : Series.str并不是python原生字符串,而是自己的一套方法,不过大部分和原生str很相似 # 本节演示内容:
# 1 获取series的str属性,然后使用各种字符串处理函数
# 2 使用str的startswith、contain等bool类series可以做条件查询
# 3 需要多次str处理的链式操作
# 4 使用正则表达式的处理 # 0 读取北京的2018天气数据
import pandas as pd
df = pd.read_csv("beijing_tianqi_2018.csv")
df.dtypes
# 换掉温度后面的后缀
# df.loc[:,"bWendu"] = df["bWendu"].str.replace("℃","").astype("int32")
# df.loc[:,"yWendu"] = df["yWendu"].str.replace("℃","").astype("int32") # 1 获取series的str属性,使用各种字符串处理函数
df["bWendu"].str
# 字符串替换函数
df["bWendu"].str.replace("℃","")
# 判断是不是数字
df["bWendu"].str.isnumeric() df["aqi"].str.len()#AttributeError: Can only use .str accessor with string values, which use np.object_ dtype in pandas # 2 使用str的startseith、contains等得到bool的series可以做条件查询
condition = df["ymd"].str.startswith("2018-03")
df[condition].head()
# 3 需要多次str处理链式操作
# 实例:
# 1 先将日期2018-03-31替换成20180331的形式
# 2 提取月份字符串201803
df["ymd"].str.replace("-","")
# 每次调用函数,都返回一个新的series
df["ymd"].str.replace("-","").str.slice(0,6)
# slice就是切片语法,可以直接用
df["ymd"].str.replace("-","").str[0:6] # 4 使用正则表达式处理
# 添加新列
def get_nianyueri(x):
year,month,day = x["ymd"].split("-")
return f"{year}年{month}月{day}日"
df["中文日期"] =df.apply(get_nianyueri,axis= 1) # 怎样将“2018年12月31日”中的年月日三个中文字符去除?
# Series.str默认就开启了正则表达式模式
#
# 方法1
# df["中文日期"].str.replace("年","").str.replace("月","").str.replace("日","") # 方法2 :正则表达式替换 df["中文日期"].str.replace("[年月日]","")
pandas处理字符串的更多相关文章
- 利用Python进行数据分析(15) pandas基础: 字符串操作
字符串对象方法 split()方法拆分字符串: strip()方法去掉空白符和换行符: split()结合strip()使用: "+"符号可以将多个字符串连接起来: join( ...
- Pandas | 11 字符串函数
在本章中,我们将使用基本系列/索引来讨论字符串操作.在随后的章节中,将学习如何将这些字符串函数应用于数据帧(DataFrame). Pandas提供了一组字符串函数,可以方便地对字符串数据进行操作. ...
- pandas 之 字符串处理
import numpy as np import pandas as pd Python has long been a popular raw data manipulation language ...
- Python数据科学手册-Pandas:向量化字符串操作、时间序列
向量化字符串操作 Series 和 Index对象 的str属性. 可以正确的处理缺失值 方法列表 正则表达式. Method Description match() Call re.match() ...
- (数据科学学习手札131)pandas中的常用字符串处理方法总结
本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 在日常开展数据分析的过程中,我们经常需要对 ...
- 04. Pandas 3| 数值计算与统计、合并连接去重分组透视表文件读取
1.数值计算和统计基础 常用数学.统计方法 数值计算和统计基础 基本参数:axis.skipna df.mean(axis=1,skipna=False) -->> axis=1是按行来 ...
- pandas 基础操作 更新
创建一个Series,同时让pandas自动生成索引列 创建一个DataFrame数据框 查看数据 数据的简单统计 数据的排序 选择数据(类似于数据库中sql语句) 另外可以使用标签来选择 通过位置获 ...
- Python 数据处理库 pandas 入门教程
Python 数据处理库 pandas 入门教程2018/04/17 · 工具与框架 · Pandas, Python 原文出处: 强波的技术博客 pandas是一个Python语言的软件包,在我们使 ...
- 「Python」pandas入门教程
pandas适合于许多不同类型的数据,包括: 具有异构类型列的表格数据,例如SQL表格或Excel数据 有序和无序(不一定是固定频率)时间序列数据. 具有行列标签的任意矩阵数据(均匀类型或不同类型) ...
随机推荐
- 从 sourcemap 中获取源码
使用 paazmaya/shuji: Reverse engineering JavaScript and CSS sources from sourcemaps 可以从 sourcemap 中获取源 ...
- day67—angularJS学习笔记控制器
转行学开发,代码100天——2018-05-22 angularJS通过控制器来控制数据流的应用. ng-controller. 控制器中包含属性和函数,其参数引用通过 $scope来执行. 如下文的 ...
- 阶段3 1.Mybatis_01.Mybatis课程介绍及环境搭建_03.jdbc操作数据库的问题分析
分析一段代码,传统的jdbc的功能,最终要实现的功能就是sql语句.
- 基于python+requests的简单接口测试
在进行接口测试时,我们可以使用已有的工具(如:jmeter)进行,也可以使用python+requests进行.以下为简单的接口测试模板: 一.提取常用变量,统一配置 新建一个config.py文件, ...
- 2018.03.29 python-pandas 数据透视pivot table / 交叉表crosstab
#透视表 pivot table #pd.pivot_table(data,values=None,index=None,columns=None, import numpy as np import ...
- visualSVN提交强制添加注释
Visual SVN Server下 右键项目 “所有任务”>“Manage Hooks” >选中Pre-commit hook然后edit编辑,添加如下代码 @echo off set ...
- Java多线程学习——wait方法(管道法/生产者消费者模式)
简单介绍管道法: 生产者生产数据输送到管道,消费者从管道拿出数据,管道为空消费者等待,管道满生产者生产,消费者消费生产者生产,生产者生产消费者消费. public class Corn { //要生产 ...
- 吴恩达机器学习(二) 单变量线性回归(Linear Regression with one variable)
一.模型表示 1.一些术语 如下图,房价预测.训练集给出了房屋面积和价格,下面介绍一些术语: x:输入变量或输入特征(input variable/features). y:输出变量或目标变量(out ...
- 第五周实验报告&学习总结
实验三 String类的应用 实验目的 掌握类String类的使用: 学会使用JDK帮助文档: 实验内容 1.已知字符串:"this is a test of java".按要求执 ...
- 第十四周总结&实验报告八
实验八 实现一个简单的记事本操作,有菜单项的 import java.awt.event.ActionEvent; import java.awt.event.ActionListener; impo ...