摘要:前些天一个很简单的SQL报了一个不常见的错误。

本文分享自华为云社区《记一次mysql关联查询格式冲突问题【五月04】》,作者: KevinQ 。

问题起源

作为CRUD程序员,最常用的功能当然是数据库查询了。

前些天一个很简单的SQL报了一个不常见的错误:

Illegal mix of collations (utf8mb4_general_ci,IMPLICIT) and (utf8mb4_unicode_ci,IMPLICIT) for operation '='

今天我们就来看看mysql的utf8mb4的两种格式问题,以及如何解决这个问题?

mysql的utf8格式与排序规则

字符集uft8与uft8mb4

在mysql中创建表并添加字段的时候,想选utf8字符集时会有两个选择:

  1. utf8
  2. utf8mb4

这两个有什么区别呢?

MySQL是在5.5.3之后才有utf8mb4的字符集可选,mb4的意思是:Most Bytes 4,可以兼容unicode。

而utf8最多支持3个字节,比如3个字节的uft8无法支持Emoji表情和不常用的汉字,以及任何新增的Unicode字符等,因此才引入了uft8mb4。

排序规则

我们这次的问题是排序规则冲突引起的:

查询语句:

SELECT * FROM table1 t1
left join table2 on t1.username = t2.username

关联字段的编码字符集均为utf8mb4,但是t1.username的排序规则是utf8mb4_general_ci,而t2.username的排序规则是utf8mb4_unicode_ci。

两种排序规则的区别与特点是什么呢?

特点

utf8mb4_unicode_ci 是基于标准的 Unicode 来排序和比较,即能够支持所有Unicode字符的精确排序;
而utf8mb4_general_ci没有实现Unicode排序规则,在遇到特殊字符时,排序可能不同。

区别

也因此,uft8mb4_general_ci相比utf8mb4_unicode_ci,前者的准确性虽然打了折扣,但是比较和排序执行的速度更快,并且,通常遇到特殊字符的顺序并不重要。

排序规则不兼容的解决方案

在mysql中,排序规则不兼容的解决方案有两种:

1、第一种,修改表字段的格式一致。

即修改表的排序规则统一为utf8mb4_unicode_ci,或者另一种。官方更推荐使用utf8mb4_unicode_ci的排序规则,借用StackOverflow上的一段话:

There is almost certainly no reason to use utf8mb4_general_ci anymore, as we have left behind the point where CPU speed is low enough that the performance difference would be important. Your database will almost certainly be limited by other bottlenecks than this.

大概意思是说,当前CPU的运行速度已经快到可以让我们不再将此排序作为一个考虑参数,而更应该开了其他开销。

2、另一种方式则是借助关键字,COLLATE

通过COLLATE属性,可以指定列的排序和比较方式。

我们在使用时,将它放在关联查询需要修改排序规则的地方:

SELECT
u.guid
FROM
`test` t
LEFT JOIN user u ON u.guid = t.guid COLLATE utf8mb4_unicode_ci
WHERE t.state = 1

如此,使用COLLATE属性,可以让使用不同排序规则的字段进行关联查询。

但是,经过测试,这样会减慢SQL查询的速度。

具体采用哪种方式,需要细细考量。

 

点击关注,第一时间了解华为云新鲜技术~

SQL报了一个不常见的错误,让新来的实习生懵了的更多相关文章

  1. SQL Server 完整备份遇到的一个不常见的错误

    1. 错误详情 有一次在手动执行数据库完整备份时遇到如下错误: 执行多次都是这个错误信息. 提示无法生成检查点,原因可能是由于系统资源(如磁盘或内存空间)不足或者有时是由于数据库损坏而造成的. 我们检 ...

  2. Unity3D 一个较常见的错误信息“rect[2] == rt->GetGLWidth() && rect[3] == rt->GetGLHeight()”

    rect[2] == rt->GetGLWidth() && rect[3] == rt->GetGLHeight() 这个错误信息的具体含义我还不太清楚.它出现以后会不停 ...

  3. SQL Server 损坏修复 之一 常见错误解读

    SQL Server 对数据库损坏的错误类型做了细化,在此对几个典型的错误作一下介绍. 错误信息是:“在文件 '%ls'中.偏移量为 %#016I64x 的位置执行 %S_MSG 期间,操作系统已经向 ...

  4. 帆软SQL报异常:多表连接的时候出现错误:未明确定义列

    我刚开始的代码: select dm_veh_jdcgz_mx.DAY_ID ,--日期 dm_veh_jdcgz_mx.GLBM ,--管理部门ID dm_veh_jdcgz_mx.SFZMHM , ...

  5. 【SD系列】SAP 查看销售订单时,报了一个错误消息,“项目不符合计划行(程序错误)”

    公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[SD系列]SAP 查看销售订单时,报了一个错误 ...

  6. sql查询报java.sql.SQLException: Column 'LC_ID' not found 的错误实际上是mysql在hibernate别名的问题

    报java.sql.SQLException: Column 'LC_ID' not found 的错误实际上是mysql在hibernate别名的问题 我的查询sql是 String sql2 =& ...

  7. mybatis学习笔记--常见的错误

    原文来自:<mybatis学习笔记--常见的错误> 昨天刚学了下mybatis,用的是3.2.2的版本,在使用过程中遇到了些小问题,现总结如下,会不断更新. 1.没有在configurat ...

  8. 【SQL】关于无法附加文件的错误

    [SQL]关于无法附加文件的错误 1.错误信息如下: 2.估计是权限问题右击属性,把权限开一下 3.然后就附加成功了~~ ——————————————————————————————————————— ...

  9. SQL SERVER 内存分配及常见内存问题 简介

    一.问题: 1.SQL Server 所占用内存数量从启动以后就不断地增加: 首先,作为成熟的产品,内存溢出的机会微乎其微.对此要了解SQL SERVER与windows是如何协调.共享内存.并且SQ ...

随机推荐

  1. Java之JDBC详谈(数据库)

    详细介绍了数据库的JDBC操作,并且整理了具体方法,有代码实现与详细注释.

  2. Prometheus+Grafana安装搭建

    介绍 Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB).Prometheus使用Go语言开发,是Google BorgMon监控系统的开源版本. 2016年 ...

  3. python基础练习题(题目 斐波那契数列II)

    day16 --------------------------------------------------------------- 实例024:斐波那契数列II 题目 有一分数序列:2/1,3 ...

  4. python基础练习题(题目 打印出所有的"水仙花数",所谓"水仙花数"是指一个三位数,其各位数字立方和等于该数本身)

    day8 --------------------------------------------------------------- 实例013:所有水仙花数 题目 打印出所有的"水仙花 ...

  5. Spring 源码(3)Spring BeanFactory 是怎么创建的?

    Spring创建 BeanFactory 的方式 按照Bean的配置方式手动创建可以分为两种: 使用XMl配置的Bean 这种方式使用xml配置文件配置Bean的信息并且设置扫描的路径,扫描到的包可以 ...

  6. [论文] FRCRN:利用频率递归提升特征表征的单通道语音增强

    本文介绍了ICASSP2022 DNS Challenge第二名阿里和新加坡南阳理工大学的技术方案,该方案针对卷积循环网络对频率特征的提取高度受限于卷积编解码器(Convolutional Encod ...

  7. 团队Arpha1

    队名:观光队 组长博客 作业博客 组员实践情况 王耀鑫 **过去两天完成了哪些任务 ** 文字/口头描述 完成服务器连接数据库部分代码 展示GitHub当日代码/文档签入记录 接下来的计划 与服务器连 ...

  8. 推荐 | Linux 思维导图整理(建议收藏)

    一个执着于技术的公众号 作者:小柑 来源:https://www.jianshu.com/p/59f759207862 今天整理了一下收集的 Linux 思维导图.上传的均为高清原图,双击即可查看,也 ...

  9. 【mq】从零开始实现 mq-07-负载均衡 load balance

    前景回顾 [mq]从零开始实现 mq-01-生产者.消费者启动 [mq]从零开始实现 mq-02-如何实现生产者调用消费者? [mq]从零开始实现 mq-03-引入 broker 中间人 [mq]从零 ...

  10. 题解0012:剪花布条(KMP)

    信奥一本通1465 KPM例题 题目链接:http://ybt.ssoier.cn:8088/problem_show.php?pid=1465 题目描述:给出花布条和小饰条(字符串),求花布条中能剪 ...