MySQL->处理重复数据[20180517]

限制数据重复的方式：表上增加主键（Primary Key）或增加唯一性索引（Unique）

主键对重复资料进行限制，这样资料在导入时就无法重复插入

create table primary_t(

last_name varchar(20),

first_name varchar(20),

sex varchar(8),

primary key(last_name,first_name)

)engine=innodb default charset=utf8;

show table status like 'primary_t'\G

show index from primary_t\G

模拟插入两笔有主键约束的资料

insert into primary_t(last_name,first_name,sex) values('Frank','Li','Man'),('Frank','Li','Man'),('Coco','Li','Woman');

ERROR 1062 (23000): Duplicate entry 'Frank-Li' for key 'PRIMARY'

insert into primary_t(last_name,first_name,sex) values('Frank','Li','Man'),('Frank','Cai','Man'),('Coco','Li','Woman');

mysql> select * from primary_t;

+-----------+------------+-------+

| last_name | first_name | sex   |

+-----------+------------+-------+

| Coco      | Li         | Woman |

| Frank     | Cai        | Man   |

| Frank     | Li         | Man   |

+-----------+------------+-------+

3 rows in set (0.00 sec)

唯一性索引对复制资料进行限制

create table unique_t(

last_name varchar(20),

first_name varchar(20),

sex varchar(8),

unique index  unique_name(last_name,first_name)

)engine=innodb default charset=utf8;

show table status like 'unique_t'\G

show index from unique_t\G

模拟插入两笔有唯一性约束的资料

insert into unique_t(last_name,first_name,sex) values('Frank','Li','Man'),('Frank','Li','Man'),('Coco','Li','Woman');

ERROR 1062 (23000): Duplicate entry 'Frank-Li' for key 'unique_name'

insert into unique_t(last_name,first_name,sex) values('Frank','Li','Man'),('Frank','Cai','Man'),('Coco','Li','Woman');

mysql> select * from unique_t;

+-----------+------------+-------+

| last_name | first_name | sex   |

+-----------+------------+-------+

| Frank     | Li         | Man   |

| Frank     | Cai        | Man   |

| Coco      | Li         | Woman |

+-----------+------------+-------+

3 rows in set (0.00 sec)

对资料的统计

create table count_t(

last_name varchar(20),

first_name varchar(20),

sex varchar(8)

)engine=innodb default charset=utf8;

insert into count_t values('Frank','A','Man'),

('Frank','B','Man'),

('Frank','C','Woman'),

('Frank','D','Man'),

('Frank','E','Man'),

('Frank','F','Woman'),

('Frank','G','Man'),

('Frank','H','Man'),

('Frank','I','Woman'),

('Coco','A','Woman'),

('Coco','B','Man'),

('Coco','C','Man'),

('Coco','D','Man'),

('Coco','E','Man'),

('Coco','F','Man'),

('Coco','G','Woman'),

('Coco','H','Woman'),

('Alex','B','Man'),

('ALex','C','Man'),

('ALex','D','Man'),

('Alex','E','Man'),

('ALex','F','Man'),

('ALex','G','Woman'),

('ALex','H','Woman')

;

commit;

按各个列进行分组统计

select last_name,count(*) from count_t group by last_name;

select first_name,count(*) from count_t group by first_name;

select sex,count(*) from count_t group by sex;

mysql> select last_name,count(*) from count_t group by last_name;

+-----------+----------+

| last_name | count(*) |

+-----------+----------+

| Alex      |        7 |

| Coco      |        8 |

| Frank     |        9 |

+-----------+----------+

3 rows in set (0.00 sec)

mysql> select first_name,count(*) from count_t group by first_name;

+------------+----------+

| first_name | count(*) |

+------------+----------+

| A          |        2 |

| B          |        3 |

| C          |        3 |

| D          |        3 |

| E          |        3 |

| F          |        3 |

| G          |        3 |

| H          |        3 |

| I          |        1 |

+------------+----------+

9 rows in set (0.00 sec)

mysql> select sex,count(*) from count_t group by sex;

+-------+----------+

| sex   | count(*) |

+-------+----------+

| Man   |       16 |

| Woman |        8 |

+-------+----------+

2 rows in set (0.00 sec)

对分组的统计在进行限定，having 大于等于8次的记录

select last_name ,count(*) from count_t group by last_name having count(*) >=8;

mysql> select last_name ,count(*) from count_t group by last_name having count(*) >=8;

+-----------+----------+

| last_name | count(*) |

+-----------+----------+

| Coco      |        8 |

| Frank     |        9 |

+-----------+----------+

2 rows in set (0.00 sec)

对资料进行去重操作，主要使用distinct函数

select distinct last_name from count_t;

select distinct first_name from count_t;

select distinct sex from count_t;

对已有资料的表进行去重操作

insert into count_t values('Xi','Xi','Man'),('Xi','Xi','Man');

增加主键约束，加入ignore，忽悠重复的资料

alter ignore table count_t

add primary key(last_name,first_name);

select * from count_t where last_name='Xi';

mysql> alter ignore table count_t

    -> add primary key(last_name,first_name);

Query OK, 26 rows affected (0.01 sec)

Records: 26  Duplicates: 1  Warnings: 0

mysql> select * from count_t where last_name='Xi';

+-----------+------------+------+

| last_name | first_name | sex  |

+-----------+------------+------+

| Xi        | Xi         | Man  |

+-----------+------------+------+

1 row in set (0.00 sec)

使用group by方式也可去除重复资料

create table count_t0 as select last_name,first_name,sex from count_t group by last_name,first_name,sex;

MySQL->处理重复数据[20180517]的更多相关文章

mysql删除重复数据只保留一条
mysql删除重复数据只保留一条新建一张测试表: CREATE TABLE `book` ( `id` char(32) NOT NULL DEFAULT '', `name` varchar(10 ...
SQL server 存储过程 C#调用Windows CMD命令并返回输出结果 Mysql删除重复数据保留最小的id C# 取字符串中间文本取字符串左边取字符串右边 C# JSON格式数据高级用法
create proc insertLog@Title nvarchar(50),@Contents nvarchar(max),@UserId int,@CreateTime datetimeasi ...
三十、MySQL 处理重复数据
MySQL 处理重复数据有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据. 本章节我们将为大家介绍如何防止数据表出现重复数据及如何删 ...
DB-MySQL：MySQL 处理重复数据
ylbtech-DB-MySQL:MySQL 处理重复数据 1.返回顶部 1. MySQL 处理重复数据有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需 ...
MySQL 处理重复数据
有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据. 本博文我们将为大家介绍如何防止数据表出现重复数据及如何删除数据表中的重复数据. 防 ...
MYSQL删除重复数据
delete from co_jobinformation cwhere c.name in (select cc.name from co_jobinformation cc group by ...
mysql 删除重复数据，并保存最新一条数据
删除重复行 DELETE FROM ecm_member_login_session WHERE (number , client_code) IN ( ) AND update_time NOT I ...
MySQL中删除重复数据的简单方法，mysql删除重复数据
MYSQL里有五百万数据,但大多是重复的,真实的就180万,于是想怎样把这些重复的数据搞出来,在网上找了一圈,好多是用NOT IN这样的代码,这样效率很低,自己琢磨组合了一下,找到一个高效的处理方式, ...
MySQL 查询重复数据，删除重复数据保留id最小的一条作为唯一数据
开发背景: 最近在做一个批量数据导入到MySQL数据库的功能,从批量导入就可以知道,这样的数据在插入数据库之前是不会进行重复判断的,因此只有在全部数据导入进去以后在执行一条语句进行删除,保证数据唯一性 ...
mysql处理重复数据
有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据. 防止表中出现重复数据你可以在MySQL数据表中设置指定的字段为 PRIMARY ...

随机推荐

Android Editable
在android的sdk中有讲,“This is the interface for text whose content and markup can be changed (as opposed ...
Android Tab与TabHost
这就是Tab,而盛放Tab的容器就是TabHost 如何实现?? 每一个Tab还对应了一个布局,这个就有点好玩了.一个Activity,对应了多个功能布局. ①新建一个Tab项目,注意,不要生成mai ...
统计nginx日志
.根据访问IP统计UV awk '{print $1}' access.log|sort | uniq -c |wc -l .统计访问URL统计PV awk '{print $7}' access.l ...
Python 生成器总结
生成器的概念: 生成器不会把结果保存在一个系列中,而是保存在生成器的状态,在每次进行迭代时返回一个值,直到遇到StopIteration异常结束生成器是这样一个函数,它记住上一次返回时在函数体中的位 ...
Python学习---django知识补充之CBV
Django知识补充之CBV Django: url --> def函数 FBV[function based view] 用函数和URL进行匹配 url --> ...
乘风破浪：LeetCode真题_019_Remove Nth Node From End of List
乘风破浪:LeetCode真题_019_Remove Nth Node From End of List 一.前言这次总算到了链表的操作了,之后肯定会有排序算法,二叉树,排序树,图等等的操作,现在我 ...
Azure 负载内部均衡器概述
Azure 内部负载均衡器 (ILB) 仅将流量定向到云服务内的资源,或使用 VPN 来访问 Azure 基础结构. 在这一点上,ILB 与面向 Internet 的负载均衡器不同. Azure 基础 ...
Maven 阿里源
由于一些不可抗拒因素,在使用 maven 的时候我们不得不需要改变一些设置,以加快我们的下载速度. 仓库配置在maven的settings.xml文件里的mirrors节点,添加如下子节点: ...
Scala编译器安装
1.安装JDK 因为Scala是运行在JVM平台上的,所以安装Scala之前要安装JDK. 2.安装Scala Windows安装Scala编译器访问Scala官网http://www.scala- ...
内网渗透中的mimikatz
0x00 前言上篇测试了中间人攻击利用框架bettercap,这次挑选一款更具代表性的工具--mimikatz 0x01 简介 mimikatz,很多人称之为密码抓取神器,但在内网渗透中,远不止这么 ...

MySQL->处理重复数据[20180517]

MySQL->处理重复数据[20180517]的更多相关文章

随机推荐

热门专题