我们经常要从外部数据源(如数据库、文本文件或网页等)将数据导入excel中,但是此类数据往往比较混乱,无法满足我们的要求,因此在进行数据分析之前,需要将这些数据进行整理清洗,excel由于将数据的管理和展示都在同一层面上,并且其函数功能也不逊色,因此在大多数情况下都可以使用excel来进行初步的数据整理:

1.删除通用前导字符串(例如其后紧跟冒号和空格的标签)或后缀(例如字符串后面的已无效或不必要的插入语),在字符串内查找和替换子字符串、提取字符串的特定部分或确定字符串的长度等字符串操作,可使用以下函数:
FIND、FINDB 
SEARCH、SEARCHB 
REPLACE、REPLACEB
SUBSTITUTE
LEFT、LEFTB
RIGHT、RIGHTB
LEN、LENB
MID、MIDB

2.某些情况下,文本表现为混用的形式,这尤其表现在其大小写形式方面。您可以使用三个大小写转换函数中的一个或多个函数,将文本转换为小写字母(如电子邮件地址)、大写字母(如产品代码)或专有名称(如名称或书名)。
LOWER():将文本字符串中的所有大写字母转换为小写字母。
PROPER():将文本字符串的首字母以及文本中任何非字母字符之后的其他字母转换成大写。将所有其他字母转换成小写字母。
UPPER():将文本转换为大写字母。

3.某些文本值包含前导空格、尾随空格或多个嵌入空格字符(Unicode 字符集值 32 和 160),或非打印字符(Unicode 字符集值 0 到 31、127、129、141、143、144 和 157)。在排序、筛选或搜索时,这些字符有时可能会引发意外结果。例如,在外部数据源中,用户可能会无意地犯一些拼写错误,例如添加多余空格字符,或者从外部源导入的文本数据可能包含嵌入文本中的非打印字符。由于轻易不会注意到这些字符,可能会很难理解出现的意外结果。若要删除这些不需要的字符,您可以使用 TRIM、CLEAN 和 SUBSTITUTE 函数的组合。
CODE():返回文本字符串中第一个字符的数字代码。
CLEAN():删除文本中 7-bit ASCII 代码的前 32 个非打印字符(值 0 到 31)。
TRIM():删除文本中的 7-bit ASCII 空格字符(值 32)。
SUBSTITUTE():可使用 SUBSTITUTE 函数将较高值的 Unicode 字符(值 127、129、141、143、144、157 和 160)替换为 7-bit ASCII 字符,这也是 TRIM 和 CLEAN 函数的设计初衷。

4.数字存在以下两种主要问题时,您需要对数据进行清理:数字被意外导入为文本时,以及需要按照组织的标准对负号进行更改时。
DOLLAR():将数字转换为文本格式并应用货币符号。
TEXT():将数值转换为特定数字格式的文本。
FIXED():将某数值舍入为指定的小数位,使用句点和逗号将数字设置为小数格式,并将结果返回为文本
VALUE():将代表数字的文本字符串转换为数字。

5.由于存在许多不同的日期格式,并且这些格式的数字部分代码或其他包含斜杠或连字符的字符串可能会令人迷惑,因此日期和时间通常需要进行转换和重新设置格式。
DATE():返回表示特定日期的连续序列数。如果输入函数之前的单元格格式为“常规”,则结果的格式将为日期。
DATEVALUE():将表示为文本的日期转换为序列数。
TIME():返回特定时间的小数。如果输入函数之前的单元格格式为“常规”,则结果的格式将为日期。
TIMEVALUE():返回表示为文本字符串形式的时间的小数。小数是介于 0(零)和 0.99999999 之间的一个值,代表从 0:00:00 (12:00:00 AM) 到 23:59:59 (11:59:59 P.M.) 范围内的时间。

6.Excel中的多数分析和格式功能都假定数据存在于单个二维平面表中。某些情况下,您可能希望将行转换为列,并将列转换为行。其他情况下,数据甚至不是以表格形式构建的,您需要通过一种方式将数据从非表格形式转换为表格形式。
TRANSPOSE():将垂直单元区域返回为水平区域,反之亦然。

7.我们有时需要查找和更正两个或多个表进行连接时的匹配错误。这可能要调整自不同工作表的表格,例如,查看两个表中的所有记录或比较表并查找不匹配的行。
LOOKUP():从单行或单列区域或数组中返回一个数据。LOOKUP 函数有两种语法形式:向量形式和数组形式。
HLOOKUP():在表格或数值数组的首行查找指定的数值,并由此返回表格或数组当前列中指定行处的数值。
VLOOKUP():在表格数组的首列查找值,并由此返回表格数组当前行中其他列的值。
INDEX():返回表或区域中的值或对值的引用。INDEX 函数有两种语法形式:数组形式和引用形式。
MATCH():返回在指定方式下与指定数值匹配的数组中元素的相应位置。如果需要找出匹配元素的位置而不是匹配元素本身,则应该使用 MATCH 函数而不是 LOOKUP 函数。
OFFSET():从一个单元格或单元格区域返回对指定了行数和列数的区域的引用。返回的引用可以为一个单元格或单元格区域。并可以指定返回的行数或列数

一些用于数据整理的excel函数的更多相关文章

  1. 数据库函数(Excel函数集团)

    此处文章均为本妖原创,供下载.学习.探讨! 文章下载源是Office365国内版1Driver,如有链接问题请联系我. 请勿用于商业! 谢谢 下载地址:https://officecommunity- ...

  2. 【Lab】提取result的bits和Y-PSNR数据并整理到Excel

    [Lab]提取result的bits和Y-PSNR数据并整理到Excel 更新:使用openpyxl库直接将数据写入Excel中 注意:openpyxl是第三方库,如果没有安装.请命令行里键入pip ...

  3. vb.net-三种将datagridview数据导出为excel文件的函数

    第一种方法较慢,但是数据格式都比较好,需要引用excel的 Microsoft.Office.Interop.Excel.dll  office.dll #Region "导出excel函数 ...

  4. vlookup函数基本使用--如何将两个Excel表中的数据匹配;excel表中vlookup函数使用方法将一表引到另一表

    vlookup函数基本使用--如何将两个Excel表中的数据匹配:excel表中vlookup函数使用方法将一表引到另一表 一.将几个学生的籍贯匹配出来‘ 二.使用查找与引用函数 vlookup 三. ...

  5. 用于数据科学的顶级 C/C++ 机器学习库整理

    用于数据科学的顶级 C/C++ 机器学习库整理 介绍和动机--为什么选择 C++ C++ 非常适合 动态负载平衡. 自适应缓存以及开发大型大数据框架 和库.Google 的MapReduce.Mong ...

  6. Excel函数大全

    我们在使用Excel制作表格整理数据的时候,经常要用到它的函数功能来自己主动统计处理表格中的数据.这里整理了Excel中使用频率最高的函数的功能.用法,以及这些函数在实际应用中的实例剖析,并配有具体的 ...

  7. 【228】◀▶ Excel 函数说明

    官方帮助:Excel 函数(按字母顺序列出) 官方帮助:Excel 函数(按类别列出) 参考:EXCEL常用函数大全 01   N_ELEMENTS 表达式或者变量的元素个数. 02   DEFSYS ...

  8. Excel 函数

    Excel 函数: 一.定义: Excel 函数即是预先定义,执行计算.分析等处理数据任务的特殊公式. 二.结构: 1.单一结构 =函数名(参数1,参数2,参数3.....) 示例:=sum(A3:A ...

  9. Excel函数学习:HLOOKUP函数

    Excel函数学习:HLOOKUP函数 HLOOKUP函数查找表的第一行中的值,返回该表中与找到的值在同一列的另一个值. 什么情况下使用HLOOKUP? HLOOKUP函数可以在查找行中找到精确匹配值 ...

随机推荐

  1. Cacti中文版在Centos上的安装

    最近老有人问Cacti中文版在哪下载啊怎么安装啊,我在这里一遍给大家讲解了:Cacti中文版在Centos上的安装 1.基本安装 cacti是运作在apache+php+mysql+net-snmp工 ...

  2. C#在泛型类中,通过表达式树构造lambda表达式

    场景 最近对爬虫的数据库架构做调整,需要将数据迁移到MongoDB上去,需要重新实现一个针对MongoDB的Dao泛型类,好吧,动手开工,当实现删除操作的时候问题来了. 我们的删除操作定义如下:voi ...

  3. GZFramwork数据库层《一》普通表增删改查

    运行结果:     使用代码生成器(GZCodeGenerate)生成tb_MyUser的Model 生成器源代码下载地址: https://github.com/GarsonZhang/GZCode ...

  4. 【翻译】《深入解析windows操作系统第6版下册》第10章:内存管理

    [翻译]<深入解析windows操作系统第6版下册>第10章:内存管理(第一部分) [翻译]<深入解析windows操作系统第6版下册>第10章:内存管理(第二部分) [翻译] ...

  5. Mysql错误问题记录

    ① Incorrect string value: '\xE6\x94\xBE\xE5\xA4\xA7...' for column 'name' at row 1 Query…… 原因:编码不匹配. ...

  6. Give My Text Back

    Give My Text Back 标签(空格分隔): 算法 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 To prepare for the English exa ...

  7. DJANGO基础学习之转义总结:escape,autoescape,safe,mark_safe

    何谓转义?就是把html语言的关键字过滤掉.例如,<div>就是html的关键字,如果要在html页面上呈现<div>,其源代码就必须是<div> PS:转义其实就 ...

  8. SQL语句like子句中的转义符

    如果想在SQL LIKE里查询有下划线'_'或是'%'等值的记录,直接写成like 'XXX_XX',则会把'_'当成是like的通配符.SQL里提供了 escape子句来处理这种情况,escape可 ...

  9. CUBRID学习笔记 40 使用net修改数据

    修改 connection.Open();     string queryString = "UPDATE nation set capital = 'X' where `code` = ...

  10. shape into blocks--source code in python based on pySpark

    这是微博深度和广度预测的原始代码,写了大约半个月,第一个版本不是这样的,但是这个版本包含所有需要的功能. 模块化的程度也更高.找工作前一直想用python完美解决这个问题,后来发现自己的方法和硬件都有 ...