MySQL 数据库中删除重复数据的方法
演示数据,仅供参考
查询表结构:
mysql> desc test;
+-------+------------------+------+-----+---------+----------------+
| Field | Type | Null | Key | Default | Extra |
+-------+------------------+------+-----+---------+----------------+
| id | int(11) unsigned | NO | PRI | NULL | auto_increment |
| site | varchar(100) | NO | MUL | | |
+-------+------------------+------+-----+---------+----------------+
2 rows in set (0.00 sec)
查询数据:
mysql> select * from test order by id;
+----+------------------------+
| id | site |
+----+------------------------+| 1 | http://www.baidu.com |
| 2 | http://www.hao123.com |
| 3 | http://www.huwei.com |
| 4 | http://www.baidu.com |
| 5 | http://www.huwei.com |
+----+------------------------+
5 rows in set (0.00 sec)
当没有创建表或创建索引权限的时候,如果你要删除较旧的重复记录,可以使用下面的语句:
mysql> delete from a
-> using test as a, test as b
-> where (a.id > b.id)
-> and (a.site = b.site);
Query OK, 2 rows affected (0.12 sec) mysql> select * from test order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.baidu.com |
| 2 | http://www.hao123.com |
| 3 | http://www.huwei.com |
+----+------------------------+
3 rows in set (0.00 sec)
如果你要删除较新的重复记录,可以使用下面的语句:
mysql> delete from a
-> using test as a, test as b
-> where (a.id < b.id)
-> and (a.site = b.site);
Query OK, 2 rows affected (0.12 sec) mysql> select * from test order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 2 | http://www.hao123.com |
| 4 | http://www.baidu.com |
| 5 | http://www.huwei.com |
+----+------------------------+
3 rows in set (0.00 sec)
你可以用下面的语句先确认将被删除的重复记录:
mysql> SELECT a.*
-> FROM test a, test b
-> WHERE a.id > b.id
-> AND (a.site = b.site);
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.baidu.com |
| 3 | http://www.huwei.com |
+----+------------------------+
2 rows in set (0.00 sec)
如果有创建索引的权限,在表上创建唯一键索引,可以用下面的方法:
mysql> alter ignore table test add unique index ukey (site);
Query OK, 5 rows affected (0.46 sec)
Records: 5 Duplicates: 2 Warnings: 0 mysql> select * from test order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.baidu.com |
| 2 | http://www.hao123.com |
| 3 | http://www.huwei.com |
+----+------------------------+
3 rows in set (0.00 sec)
重复记录被删除后,如果需要,可以删除索引:
mysql> alter table test drop index ukey;
Query OK, 3 rows affected (0.37 sec)
Records: 3 Duplicates: 0 Warnings: 0
如果有创建表的权限,创建一个新表,然后将原表中不重复的数据插入新表:
mysql> create table test_new as select * from test group by site;
Query OK, 3 rows affected (0.19 sec)
Records: 3 Duplicates: 0 Warnings: 0 mysql> show tables;
+----------------+
| Tables_in_test |
+----------------+
| test |
| test_new |
+----------------+
2 rows in set (0.00 sec) mysql> select * from test order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.baidu.com |
| 2 | http://www.hao123.com |
| 3 | http://www.huwei.com |
| 4 | http://www.baidu.com |
| 5 | http://www.huwei.com |
+----+------------------------+
5 rows in set (0.00 sec) mysql> select * from test_new order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.baidu.com |
| 2 | http://www.hao123.com |
| 3 | http://www.huwei.com |
+----+------------------------+
3 rows in set (0.00 sec)
然后将原表备份,将新表重命名为当前表:
mysql> rename table test to test_old, test_new to test;
Query OK, 0 rows affected (0.04 sec) mysql> show tables;
+----------------+
| Tables_in_test |
+----------------+
| test |
| test_old |
+----------------+
2 rows in set (0.00 sec) mysql> select * from test order by id;
+----+------------------------+
| id | site |
+----+------------------------+
| 1 | http://www.baidu.com |
| 2 | http://www.hao123.com |
| 3 | http://www.huwei.com |
+----+------------------------+
3 rows in set (0.00 sec)
注意:使用这种方式创建的表会丢失原表的索引信息!
mysql> desc test;
+-------+------------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+-------+------------------+------+-----+---------+-------+
| id | int(11) unsigned | NO | | 0 | |
| site | varchar(100) | NO | | | |
+-------+------------------+------+-----+---------+-------+
2 rows in set (0.00 sec)
MySQL 数据库中删除重复数据的方法的更多相关文章
- 清空SQL Server数据库中所有表数据的方法(转)
清空SQL Server数据库中所有表数据的方法 其实删除数据库中数据的方法并不复杂,为什么我还要多此一举呢,一是我这里介绍的是删除数据库的所有数据,因为数据之间可能形成相互约束关系,删除操作可能陷入 ...
- 清空SQL Server数据库中所有表数据的方法
原文:清空SQL Server数据库中所有表数据的方法 其实删除数据库中数据的方法并不复杂,为什么我还要多此一举呢,一是我这里介绍的是删除数据库的所有数据,因为数据之间可能形成相互约束关系,删除操作可 ...
- MySQL_(Java)使用JDBC向数据库中删除(delete)数据
MySQL_(Java)使用JDBC向数据库发起查询请求 传送门 MySQL_(Java)使用JDBC向数据库中插入(insert)数据 传送门 MySQL_(Java)使用JDBC向数据库中删除(d ...
- C#实现MySQL数据库中的blob数据存储
在MySQL数据库中,有一种blob数据类型,用来存储文件.C#编程语言操作MySQL数据库需要使用MySQL官方组件MySQL.Data.dll. Mysql.Data.dll(6.9.6)组件下载 ...
- MySQL中删除重复数据的简单方法,mysql删除重复数据
MYSQL里有五百万数据,但大多是重复的,真实的就180万,于是想怎样把这些重复的数据搞出来,在网上找了一圈,好多是用NOT IN这样的代码,这样效率很低,自己琢磨组合了一下,找到一个高效的处理方式, ...
- MSSQL如何在没有主键的表中删除重复数据
为了对重复数据进行实验,下面建一个设计不太好(没有主键)表并插入了一些重复数据: create database testdb use testdb ; go create table DupsNoP ...
- MySQL查询及删除重复记录的方法
查询及删除重复记录的方法(一)1.查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断select * from peoplewhere peopleId in (select p ...
- mysql 存储过程批量删除重复数据
表结构: LOAD DATA INFILE '/usr/local/phone_imsi_12' replace INTO TABLE tbl_imsi2number_new FIELDS TERMI ...
- Oracle 数据库表删除重复数据
删除重复数据并保留一条 方法一 1.建立临时表,记录重复的数据 create table 临时表 as select a.字段1,a.字段2,max(a.rowid) as dataid from 原 ...
随机推荐
- SpringBoot系列之快速创建项目教程
本博客简介一下SpringBoot快速创建工程的方法,主要介绍一下Spring Initializer,Spring Initializer是IntelliJ IDEA才集成的一种快速创建Spring ...
- Linux常见命令之权限管理命令
chmod命令 chmod命令用来变更文件或目录的权限.在UNIX系统家族里,文件或目录权限的控制分别以读取.写入.执行3种一般权限来区分,另有3种特殊权限可供运用.用户可以使用chmod指令去变更文 ...
- 【Java线程与内存分析工具】VisualVM与MAT简明教程
目录 前言 VisualVM 安装与配置 本地使用 远程监控 MAT 使用场景 安装与配置 获得堆转储文件 分析堆转储文件 窥探对象内存值 堆转储文件对比分析 总结 前言 本文将简要介绍Java线程与 ...
- java 类内部定义接口
java类内部可以定义接口,作用可以看作是对类功能的进一步补充,类里面包含两部分:一部分是自己的固定的,一部分是可以变化的,而这可变的部分就编程了一个接口. 另一个作用是避免命名冲突. 示例 类Fru ...
- 【maven】【idea】使用idea的maven进行deploy操作失败,报错:Failed to execute goal org.apache.maven.plugins:maven-deploy-plugin:2.7:deploy (default-deploy) on project proengine-db-sdk: Failed to deploy artifacts 错误码401
使用idea的maven进行deploy操作失败,报错: Failed to execute goal org.apache.maven.plugins:maven-deploy-plugin:- f ...
- Java日期时间API系列7-----Jdk8中java.time包中的新的日期时间API类的特点
1.不变性 新的日期/时间API中,所有的类都是不可变的,这对多线程环境有好处. 比如:LocalDateTime 2.关注点分离 新的API将人可读的日期时间和机器时间(unix timestamp ...
- IOC控制反转、Unity简介
参考博客地址: Unity系列文章,推荐:http://www.cnblogs.com/qqlin/archive/2012/10/16/2717964.html https://www.cnblog ...
- 阿里P7工作总结:Spring MVC的工作原理,看完受益匪浅
这篇文章将深入探讨Spring框架的一部分——Spring Web MVC的强大功能及其内部工作原理. 项目安装 在本文中,我们将使用最新.最好的Spring Framework 5.我们将重点介绍S ...
- JS实现深浅拷贝
1.实现浅拷贝 // 1. ...实现 let copy1 = {...{x:1}} // 2. Object.assign实现 let copy2 = Object.assign({}, {x:1} ...
- SparkStreaming整合flume
SparkStreaming整合flume 在实际开发中push会丢数据,因为push是由flume将数据发给程序,程序出错,丢失数据.所以不会使用不做讲解,这里讲解poll,拉去flume的数据,保 ...