Pandas模块 --- 字符与日期型数据的处理
1,pd.to_datetime( 要转换的日期, format= ),
2,pd.to_datetime.today( ).year ,pd.to_datetime.now( ).year
3,字符串的astype方法:字段类型转换,
4,日期.dt.year :必须加dt
5,删除字段: df. drop ([ ] , axis=1, inplace=True)
df是数据框的名字,列表[ ] 里是要删除的字段名,
axis=1表示在水平方向,因为默认drop方法是用来删除数据库中的行记录,
inplace=True表示会影响原数组
6,序列的apply ( ) 方法 , apply( func= , )
7,序列使用.str后,可以转换为字符串类型
df=pd.read_excel(r'E:\Python学习资料\data_test03.xlsx')
# print(df)
print("df的类型:",type(df))
print("数据集DataFrame的维数:",df.ndim)
print("元素类型:\n",df.dtypes)
print("\n元素个数:",df.size) #转换字段的数据类型
df.birthday=pd.to_datetime(df.birthday,format='%Y-%m-%d')
df.tel=df.tel.astype("str") #将手机号中间4位隐藏起来
df.tel=df.tel.apply(func=lambda x:x.replace(x[3:7],"*****")) #添加域名domain,年龄age,工龄workage,专业profession
df['domain']=df.email.apply(func=lambda x:x.split("@")[1])
df['age']=pd.datetime.today().year-df.birthday.dt.year
df['workage']=pd.datetime.today().year-df.birthday.dt.year
df['profession']=df.other.str.findall("专业:(.*?),")
#这种方法能去掉专业外面的 中括号
df['major']=df.other.str.findall("专业:(.*?),").str[0] #删除'birthday','start_work','other'这几个变量
df.drop(['birthday','start_work','other'],axis=1,inplace=True) #各种操作之后的数据集
print("\n",df)

Pandas模块 --- 字符与日期型数据的处理的更多相关文章
- pandas中对日期型数据进行处理
因为数据不方便展示,直接上代码. 将字符串转为datetime64[ns]格式: pd.to_datetime('2019-12-20') or pd.to_datetime('20191220') ...
- Pandas模块
前言: 最近公司有数据分析的任务,如果使用Python做数据分析,那么对Pandas模块的学习是必不可少的: 本篇文章基于Pandas 0.20.0版本 话不多说社会你根哥!开干! pip insta ...
- Pandas模块:表计算与数据分析
目录 Pandas之Series Pandas之DataFrame 一.pandas简单介绍 1.pandas是一个强大的Python数据分析的工具包.2.pandas是基于NumPy构建的. 3.p ...
- 开发技术--pandas模块
开发|pandas模块 整了一篇关于pandas模块的使用文章,方便检查自己的学习质量.自从使用了pandas之后,真的是被它的功能所震撼~~~ 前言 目前所有的文章思想格式都是:知识+情感. 知识: ...
- pandas模块补充
数据分析模块pandas和matplotlib补充 面向百度式编程 面向百度式工作 遇到没有见过的知识点或者是相关知识点一定不要慌,结合百度和已知的知识点去学习 pandas模块补充 基于numpy构 ...
- python之pandas模块
一.pandas模块是基于Numpy模块的,pandas的主要数据结构是Series和DadaFrame,下面引入这样的约定: from pandas import Series,DataFrame ...
- Python 数据处理扩展包: numpy 和 pandas 模块介绍
一.numpy模块 NumPy(Numeric Python)模块是Python的一种开源的数值计算扩展.这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list str ...
- 一句Python,一句R︱pandas模块——高级版data.frame
先学了R,最近刚刚上手python,所以想着将python和R结合起来互相对比来更好理解python.最好就是一句python,对应写一句R. pandas可谓如雷贯耳,数据处理神器. 以下符号: = ...
- 关于Python pandas模块输出每行中间省略号问题
关于Python数据分析中pandas模块在输出的时候,每行的中间会有省略号出现,和行与行中间的省略号....问题,其他的站点(百度)中的大部分都是瞎写,根本就是复制黏贴以前的版本,你要想知道其他问题 ...
随机推荐
- xcode红色文件夹或文件解决方法
文件夹或文件变红是找不到文件导致,解决方法如下: 选中红色的文件或者文件夹,在最右边出现菜单里面有个Location,下一行有个文件夹按钮,点击选择正确的文件路径或者文件就可以了.
- kubectl rollout回滚和autoscale自动扩容
系列目录 kubernetes 滚动升级 Kubernetes 中采用ReplicaSet(简称RS)来管理Pod.如果当前集群中的Pod实例数少于目标值,RS 会拉起新的Pod,反之,则根据策略删除 ...
- 象棋中“车”的攻击范围_C#
如题: var a = new String[8,8]; int h, l; Console.WriteLine("输入车所在的行(0-7):"); h = int.Parse(C ...
- Ubuntu 下安装zsh和oh-my-zsh
注意:安装前先备份/etc/passwd 一开始装oh-my-zsh我是拒绝的,因为这东西安装容易,卸载难,真的很难. Mac安装参考:http://www.cnblogs.com/EasonJim/ ...
- 使用基础知识完成java小作业?强化练习-1.输入数组计算最大值-2.输出数组反向打印-3.求数组平均值与总和-4.键盘输两int,并求总和-5.键盘输三个int,并求最值;
完成几个小代码练习?让自己更加强大?学习新知识回顾一下基础? 1.输入数组计算最大值 2.输出数组反向打印 3.求数组平均值与总和 4.键盘输两int,并求总和 5.键盘输三个int,并求最值 /* ...
- Python之路(第四十四篇)线程同步锁、死锁、递归锁、信号量
在使用多线程的应用下,如何保证线程安全,以及线程之间的同步,或者访问共享变量等问题是十分棘手的问题,也是使用多线程下面临的问题,如果处理不好,会带来较严重的后果,使用python多线程中提供Lock ...
- 通过腾讯邮件服务器发送HTML邮件
邮件发送工具: private static String host = "smtp.exmail.qq.com";// 服务器地址 private static String p ...
- JAVA构造器,重载与重写
1. java构造器 构造器也叫构造方法(constructor), 用于对象初始化. 构造器是一个创建对象时被自动创建的特殊方法,目的是对象的初始化. 构造器 的名称与类的名称一致. JAVA通过n ...
- redis windows下载地址
https://github.com/MicrosoftArchive/redis/tags
- PAT 乙级 1023.组个最小数 C++/Java
题目来源 给定数字 0-9 各若干个.你可以以任意顺序排列这些数字,但必须全部使用.目标是使得最后得到的数尽可能小(注意 0 不能做首位).例如:给定两个 0,两个 1,三个 5,一个 8,我们得到的 ...