一 、一般分离

时间:2017年11月27日14:55:12  数据如下:

501陈**:田莨铺58
502陈**:田莨铺58
503陈**。六麻杨冲58元
504陈**。石脚哗。200元
505陈**。中垌。58元
506陈**。中垌。58元
509陈**。河浪。108元

要分成 序号可以排序,屋名可以排序,金额可以排序。所以要分成四列,后面并且有元字。

分列前进行清洗整理数据:

1、陈字之前 替换多一个空格,

2、先去掉元字

3、地址前后添加多一个空格,【可以用替换的方式】

分列:

把数据放在A列,ctrl+shift +向下箭头 全选一列。使用xls中的 :数据--分列

选择好分隔符号

    

排序:选择全部数据,自定义排序。选择第一个排序 再选择第二个排序--->完成!

二、只是统计一篇文本中的金额总数,有其他数字干扰===2017年12月8日14:38:32

某一天需要帮忙核对数据的总数,而不需要进行太花哨的整理:

采用快速去除其他文字,留下数字的方法:(提取数据)

陈字 前面加上&  用陈替换成 &陈,

采用xls 数字-分列 分隔符 &

去除序号,这样就去除了干扰数字。把右边部分的放到新的xls,利用公式提取所有数字和小数点出来。注意是否还有其他干扰的数字,如果有要想办法去掉。

=LOOKUP(9E+307,--MID(A1,MIN(FIND({0;1;2;3;4;5;6;7;8;9},A1&1234567890)),ROW($1:$1022)))   数据放在A列,此公式放在B1单元格,注意公式里面的A1(相对A1取值),下拉。即得到所有数据。

全选B列 即可得到总数,谢谢各位看官

===2017年12月13日10:01:23 用 nodepad++工具 中用正则替换掉中文

准备工作:先安装nodepad++ 工具,和到下方网站看看,获取你需要的正则表达式

  在线正则表达式测试  http://tool.oschina.net/regex#

本人用第一个正则表达式 [\u4e00-\u9fa5] 替换有问题;选择第二个的正则表达式是:[^\x00-\xff]

实际操作:还是要先吧序号去掉,上面截图的设置,全部替换后:

替换后还会有英文的 :号存在,因为英文下的“:”不是双字节,也再次把:替换为空。

此时有很多空格存在,  编辑--空白操作--移除行首和行尾空格。把整列复制到xls统计。

有时候会反过来操作,要去掉数字保留文字 ,可以正则 \d 替换问空字符即可。

==待续》。。

拓展:需要配合正则快速剔除 文本 或数字技能,各种替换

整列复制 ctrl +左键+十字光标(放上去边界变成十字是左键拖动)

整列移动  shift +左键+十字光标(放上去边界变成十字是左键拖动)

====筛选出某一批序号在一个表格里面的位置(整批找出)

如果需要用到 用到countif 函数

WPS 表格筛选两列相同数据-完美-2017年11月1日更新 - 海蓝steven - 博客园
http://www.cnblogs.com/rogge7/p/5227890.html

WPS或xls 数据分列 清洗的更多相关文章

  1. C#/VB.NET Excel数据分列

    C#/VB.NET Excel数据分列 有时候我们需要将保存在Excel单元格中的组合型数据拆分为多列(如将全名拆分为姓和名两列)以方便我们处理.记忆或保存.为了避免重复和大量的手动输入工作,Exce ...

  2. MySQL 数据库出现导入xls数据出现1062主从错误错误问题解决方案

    今天把xls数据表导入MySQL数据库时发现出现1062错误    ,并且有20-700条数据一直导入不了所以开始找解决方案. 解决方案1:   数据库表设计问题导致相同字段的重复数据不能导入   解 ...

  3. 视频网站数据MapReduce清洗及Hive数据分析

    一.需求描述 利用MapReduce清洗视频网站的原数据,用Hive统计出各种TopN常规指标: 视频观看数 Top10 视频类别热度 Top10 视频观看数 Top20 所属类别包含这 Top20 ...

  4. excel wps access mysql数据表格的查询之路

    简直血崩,最近去做兼职,每天都有大量的表格数据要整理. 开始 还是 用 excel的用起来还算顺畅,慢慢慢慢的发现了各种弊端.大概类似于分组排序什么什么的好多啦~~~不过也确实是用了不到两个小时就能比 ...

  5. JAVA中读取xls数据方法介绍

    用例编号(UI-0001) 用例名称({验证页面跳转|验证元素文本}-简要明确表述) 验证类型 是否执行 初始URL 初始元素xpath 目标元素xpath 目标元素属性 期望结果 UI-0001 验 ...

  6. matlab读xls数据

    [ndata,label,abalone]=xlsread('data.xls') ndata:表示数字属性 label:表示类别属性 abalone:全部数据

  7. python爬虫——对爬到的数据进行清洗的一些姿势(5)

    做爬虫,当然就要用数据.想拿数据进行分析,首先清洗数据.这个清洗数据包括清除无用数据列和维度,删除相同数据,对数据进行勘误之类的. 从各大不同新闻网站可以爬到重复新闻...这个可以有.之前为了对爬到的 ...

  8. 如何使用正则做文本数据的清洗(附免费AI视频福利)

    手工打造文本数据清洗工具 作者 白宁超 2019年4月30日09:43:59 前言:数据清理指删除.更正错误.不完整.格式有误或多余的数据.数据清理不仅仅更正错误,同样加强来自各个单独信息系统不同数据 ...

  9. excel提取一类具有相似结构的部分数据,2种方式;数据——分列——分割符号/固定宽度;

    1.数据如同下图,这里我们需要提取 ¥...¥,也就是2¥及其中的内容: 鼠标选种某条数据,然后按Ctrl+A,则选种需要的所有数据:点击数据——分列:  2.根据分割符号分列:  3.选择合适的分隔 ...

随机推荐

  1. Linux:Day12(下) 进程、任务计划

    vmstat命令: vmstat [options] [delay [ count]] procs: r:等待运行的进程的个数: b:处于不可中断睡眠态的进程个数:(被阻塞的队列的长度): memor ...

  2. day16--包的认识、循环导入、绝对导入、相对导入、模块的搜索路径等(待续)

    ''' 一系列功能模块的集合体 -- 包就是管理功能相近的一系列模块的文件夹 -- 该文件夹包含一个特殊文件__init__.py -- 文件夹名就是包名,产生的包名就是指向__init__.py的全 ...

  3. @deprecated 的方法处理

    因为需要用到poi,偷懒不太想看官方文档,同时自己的github账号忘记密码了.所以直接在别人博客那拷贝一段代码来模仿修改创建HSSF的xsl文件. 虽然能运行,但发现代码太多横线,可以知道方法被标注 ...

  4. 《Effective C++》实现:条款26-条款31

    条款26:尽可能延后变量定义式的出现时间 C++推荐在使用对象前才定义对象(调用构造函数赋初值) 只在循环中使用的变量定义在循环内部(除非"赋值"成本低于"构造+析构&q ...

  5. js02-常用流程控制语句

    1.if语句 语法:if(条件){ 条件成立时执行 }else{ 条件不成立执行 } 例 var ji = 20; if(ji>=20){ console.log('恭喜你,吃鸡成功,大吉大利' ...

  6. union的特性,去重与不去重

    转载:https://blog.csdn.net/kingmax54212008/article/details/33762921 union的特性,去重与不去重 集合操作有 并,交,差 3种运算. ...

  7. 使用jenkins进行前端项目自动部署

    前面的话 后端的nodeJS项目可以使用pm2进行自动部署,由于前端项目打包后是静态资源,不需要进程守护.一般地,前端项目使用jenkins来进行自动部署,包括打包.测试等一系列流程.本文将详细介绍j ...

  8. kuangbin最小生成树专题

    网址:https://vjudge.net/contest/66965#overview 第一题: poj1251 裸最小生成树 #include<iostream> #include&l ...

  9. WebView 安全之 addJavascriptInterface

    WebView是Android平台下的一个重要组件,通常用来在Activity中嵌入一个简单的浏览器,实现在线网页浏览的功能.比如下面代码实现访问Google页面: WebView webView = ...

  10. 【XSY3139】预言家 数位DP NFA

    题目描述 有一个定义在 \(\{0,1,2,3,4,5,6,7,8,9\}\) 上的合规表达式,包含三种基本的操作: 结合:\(E_1E_2\) 分配:\((E_1|E_2|\ldots|E_n),n ...