用Excel做数据分析常用函数(数据清理、关联匹配……)
本文总结在使用Excel进行数据分析时,最常用的功能和函数。
Excel的功能和函数非常多,用进废退,除了学习基本的函数和功能,最重要的是遇到问题可以快速的搜索并解决。
首先Excel可以处理的数据量有大多?
使用Ctrl + → , Ctrl + ↓可以看到下界为104,8576,右界为24(X)*6(F)*4(D)=576 (Excel 2010版本)


一、数据清理
1)Trim()--空格清理
清除掉字符串两边的空格
2)CONCATENATE()--连接
CONCATENATE函数与“&”连接符都可以用来连接多个文本字符串,当要连接的内容较多时,用函数比较方便。
3)Replace()--替换
replace(需要进行替换的字符串,替换起点,替换字符个数,替换成什么内容)
替换起点是从1开始计数的,空格也算位数

4)substitute()--替换
substitute(需要替换的文本,旧文本,新文本,[instance_num])
instance_num用来指定以 new_text新文本替换第几次出现的旧文本,不设定则默认替换所有出现过的旧文本

substitute函数经常用来去掉文本之间的空格

5)Left/Right/Mid--截取
Left/Right(指定字符串,截取位数)
Mid(指定字符串,开始位置,截取长度)
6)Len/Lenb--长度计算
返回字符串的长度,在len中,中文计算为一个,在lenb中,中文计算为两个。
7)Find/search--查找
Find(要查找的字符串,被查找的字符串,从第几个字符开始查找(默认1,从头查找))
返回某字符串出现的位置,与Left/Right/Mid结合能完成简单的文本提取

search和Find类似,区别是Search大小写不敏感,且支持通配符
二、关联匹配
1)VLookup/Lookup
VLookup(①找什么,②在哪个区域找,③返回第几列,④匹配类型)
②区域要包含①③列,且①在第一列
④0为精确匹配,1为模糊匹配:找小于等于自己的最大值,多用于找区间

2)Index+Match
可以比Vlookup更灵活的完成查找匹配的任务
Match(找什么,查找区域,匹配类型) 匹配类型:大于、小于或等于
Index(查找区域,②返回第几行数据,返回第几列数据)
Index和match结合使用,Index②使用Match返回的行数

3)row/column/offset
row()返回单元格所在的行数,column()返回单元格所在的列数
OFFSET(起始点,向下移动行数,向右移动列数,取值行数,取值列数)
返回距离起始点的值或者区域。正数代表向下或向左,负数则相反。
offset(X,Y,Z,1,1)返回单值
ctrl+shift+enter返回数组

三、逻辑运算类
IF/IFS/AND/OR/ISERROR/ISERR/ISTEXR/ISNA,嵌套使用
四、计算统计类
常用的基础计算、分析、统计函数,以描述性统计为准。
1)Sum/Sumif/Sumifs--求和
根据指定条件对若干单元格进行求和,
sumif(条件区域,求和条件,实际求和区域)
sumifs(实际求和区域,条件区域1,求和条件1,条件区域2,求和条件2……)
2)Count/Countif/Countifs--计数
根据指定条件对若干单元格进行计数
Countifs(条件区域1,条件1,条件区域2,条件2……)
3)Sumproduct
sumproduct(数组1,数组2……)
返回数组元素对应相乘的和,数组形状需一致
4)Rank--排名
rank(排名对象,排名区域,[升序or降序]) (0降序1升序)
排名区域注意绝对引用。重复值会有相同的排名
不重复排名的解决:使用countif计数辅助

5)Rand/Randbetween--随机数
前者返回0~1之间的随机值,后者返回指定范围的整数
6)average--平均数
7)Quartile--四分位数
Quartile(区域,四分位点)
四分位点0-4对应,min,Q1,Q2,Q3,max
8)Stdev--标准差
9)Substotal
10)Int/Round
int向下取整
round按小数位取数。round小数点位数设为0,正数向上,负数向下取整
五、时间序列
1)Year/Month/Day/Weekday
返回日期中的年/月/日/星期数
2)now
返回当前时间戳,动态函数
3)today
返回今天的日期,动态函数
4)Datedif
DATEDIF(start_date,end_date,参数)
用Excel做数据分析常用函数(数据清理、关联匹配……)的更多相关文章
- 思迈特软件Smartbi:Excel数据分析常用函数汇总!
多传统行业的数据分析师只要求掌握Excel即可,会SPSS/SAS是加分项.即使在挖掘满街走,Python不如狗的互联网数据分析界,Excel也是不可替代的. Excel是我们工作中经常使用的一种工具 ...
- 别人都在用数据分析软件,你还在用excel做数据分析?
之前听朋友吐槽过,他们是上千人的企业,但做数据分析居然还是靠手动上传数据,而且还是用的excel做的.但其实excel并不是企业做数据分析的好工具. 数据分析是指用适当的统计分析方法对收集来的大量数据 ...
- 还在用Excel做数据分析?别人都在用数据分析工具啦!
"Excel在过去.现在和未来都是一个无比优秀和天才的工具,无数虔诚的信徒将其奉为唯一的法门,而我却并不在其中了." 作为一个数据分析师,Excel是我入门必备的数据分析工具,虽然 ...
- orale做报表常用函数和表达式的总结
最近一段时间连续的做了几十张报表,通过原生sql对数据进行分析 ,也算是有了一定的了解,发现其中一些函数和表达式使用频率较高,现总结如下: (1).round()函数 round函数说白了就是把一 ...
- python中数据分析常用函数整理
一. apply函数 作用:对 DataFrame 的某行/列应用函数之后,Apply 返回一些值.函数既可以使用默认的,也可以自定义.注意:在第二个输出中应用 head() 函数,因为它包含了很多行 ...
- python数据分析之:数据清理,转换,合并,重塑(二)
一:移除重复数据 DataFrame经常出现重复行,就像下面的这样 In [7]: data=DataFrame({'k1':['one']*3+['two']*4,'k2':[1,1,2,3,3,4 ...
- python数据分析之:数据清理,转换,合并,重塑(一)
DataFrame合并: merge运算是将一个或多个键将行链接起来.来看下面的这个例子: In [5]: df1=DataFrame({'key':['b','b','a','c','a','a', ...
- 数据分析常用的Excel函数
Excel是我们工作中经常使用的一种工具,对于数据分析来说,这也是处理数据最基础的工具. 本文对数据分析需要用到的函数做了分类,并且有详细的例子说明,文章已做了书签处理,点击可跳转至相应位置. 函数分 ...
- Python数据分析--Numpy常用函数介绍(2)
摘要:本篇我们将以分析历史股价为例,介绍怎样从文件中载入数据,以及怎样使用NumPy的基本数学和统计分析函数.学习读写文件的方法,并尝试函数式编程和NumPy线性代数运算,来学习NumPy的常用函数. ...
随机推荐
- [备忘]js表单序列化代码
function serialize(form) { var parts = [], elems = form.elements, i = 0, len = elems.length, filed = ...
- 白痴级教程,新手看过来,具详细实操文档 (word图片复制不过来,0202年了还有这样的不便利,下回研究一下,图片下次补)
一.环境配置(win10): 1.配置cmd的python环境为arcmap10.2 自带的python解释器(2.7.3)(自带arcpy库) 具体操作: 1我的电脑右击属性,打开 (选中path点 ...
- Python笔记_第一篇_面向过程_第一部分_1.Python环境的设置(含虚拟机)
*Python环境的设置 Python的环境设置也就是所需工作平台的软件搭建.常用的搭建平台IOS系统+Linux系统和Windows+Linux系统的搭建.这里主要说明的是Windows+Linux ...
- Linux上创建RStudio快捷方式
在Linux平台上经常会有一些软件需要通过命令行的方式启动,这没有图标启动方便,下面是在Linux平台为RStudio创建图标链接的方法: 下面以在桌面上创建RStudio快捷方式为例: (1) 首先 ...
- [kuangbin 带你飞] DP专题——HDU - 1024
Max Sum Plus Plus Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others ...
- offer(背包问题、DP)
蒜头君很早就想出国,现在他已经考完了所有需要的考试,准备了所有要准备的材料,于是,便需要去申请学校了.要申请国外的任何大学,你都要交纳一定的申请费用,这可是很惊人的.蒜头君没有多少钱,总共只攒了n万元 ...
- 01 语言基础+高级:1-5 常用API第二部分_day01.【Object类、常用API: Date类、System类、StringBuilder类】
day01[Object类.常用API] 主要内容 Object类 Date类 DateFormat类 Calendar类 System类 StringBuilder类 包装类 java.lang.O ...
- NFS简介和配置 一
一.简介 NFS(Network File System/网络文件系统): 1).设置Linux系统之间的文件共享(Linux与Windows中间文件共享采用SAMBA服务): 2) ...
- Python入门方法推荐,哪些基础知识必学?
很多想入门的小伙伴还不知道Python应该怎么学,哪些知识必学,今天我们就来盘点一下. 01.入门方法推荐 总体来讲,找一本靠谱的书,由浅入深,边看边练. 网上的学习教程有很多,多到不知道如何选择.所 ...
- C盘满了解决办法之pagefile.sys文件
pagefile.sys文件一般存在于C盘,只有点击了隐藏属性才能看见. 这个文件一般比较大,它是系统创建虚拟内存页面的文件.平时大家使用软件的时候对于产生大量的临时数据,这些数据需要占用大量内存,如 ...