MySQL2.字符集

此节记录下MySQL出现乱码的原因。还是参考小册子~

字符集简介

计算机中只能存储二进制数据,建立字符与二进制数据的映射关系来存储字符。

从两方面考虑:
1.界定清楚字符范围,即哪些字符映射成二进制数据
2.怎么映射
将一个字符映射成一个二进制数据的过程叫做编码,将二进制数据映射到字符叫做解码

人们抽象出一个字符集的概念来描述某个字符范围的编码规则。如用0001代表a字符

重要的字符集

  • ASCII
    共128个字符,使用1个字节来编码
  • ISO 8859-1 latin1
    256个字符
  • GB2312
    兼容ASCII,采用变长编码方式(表示一个字符需要的字节数可能不同),2个字节
  • GBK
    只是对GB2312作了扩充
  • utf8
    收录地球上所有能想到的字符,采用变长编码,一个字符需要使用1~4个字节。

MySQL中支持的字符集和排序规则

utf8 utfmb4

在MySQL中字符集表示一个字符所用最大字节长度在某些方面会影响系统的存储和性能。

所以MySQL中定义了两个概念:

  • utf8mb3:只使用1~3个字节表示字符,即utf8
  • utf8mb4:使用1~4个字节表示字符

字符集和比较规则的应用

各个级别的字符集和比较规则

MySQL有4个级别的字符集和比较规则

  • 服务器级别
  • 数据库级别
  • 表级别
  • 列级别

服务器级别:可以在启动服务器程序时通过启动选项或者在服务器程序运行过程中修改如下配置,

character_set_server=gbk
collation_server=gbk_chinese_ci

数据库级别:在创建和修改数据库的时候可以指定字符集和比较规则。

CREATE DATABASE 数据库名
    [[DEFAULT] CHARACTER SET 字符集名称]
    [[DEFAULT] COLLATE 比较规则名称];

ALTER DATABASE 数据库名
    [[DEFAULT] CHARACTER SET 字符集名称]
    [[DEFAULT] COLLATE 比较规则名称];

SHOW VARIABLES LIKE 'character_set_database';    

表级别:在创建和修改表的时候指定。如果没有指定,则默认使用该表所在的库的字符集。

列级别:对于存储字符串的列,同一个表中的不同列也可以有不同的字符集和比较规则

CREATE TABLE 表名(
    列名 字符串类型 [CHARACTER SET 字符集名称] [COLLATE 比较规则名称],
    其他列...
);

ALTER TABLE 表名 MODIFY 列名 字符串类型 [CHARACTER SET 字符集名称] [COLLATE 比较规则名称];

修改字符集或仅修改比较规则

字符集和比较规则是互相有联系的

  • 只修改字符集,比较规则将变为修改后的字符集默认的比较规则
  • 只修改比较规则,字符集将变为修改后的比较规则的字符集

MySQL客户端和服务器通信中的字符集

从MySQL客户端向服务器发送请求到返回结果这个过程中经过3个系统变量:

  • character_set_client 请求时使用的字符集
  • character_set_connection 服务器处理请求时会把请求字符串从character_set_client转为character_set_connection
  • character_set_results 服务器向客户端返回数据时使用的字符集

服务器认为客户端发送过来的请求时用character_set_client
服务器将把得到的结果集使用character_set_results返回给客户端;
character_set_connection只是服务器在将请求的字节串从character_set_client转换为character_set_connection时使用,要注意的是该字符集包含的字符范围一定涵盖请求中的字符。

为此,MySQL提供了set names 字符集名来统一这3个字符。

比较规则

作用通常体现在比较字符串大小的表达式以及某个字符串列进行排序,所以也称为排序规则。

MySQL2.字符集乱码的更多相关文章

  1. MySQL字符集乱码详解

    对于MySQL数据库中出现乱码经常是新手碰到的一个头痛的问题,不知道为什么经常出现中文乱码. 1.对于所谓的数据库中乱码,其实这中说法是错误的,只是我们不认识服务器给我们的字符.其实还是原来的字符?那 ...

  2. mysql proxy 数据库读写分离字符集乱码

    mysql proxy 数据库读写分离字符集乱码 解决办法 在对应配置后端数据库服务器的配置.cnf中加入如下代码 init-connect='SET NAME UTF8' skip-characte ...

  3. springboot字符集乱码

    入门扫盲:https://www.2cto.com/database/201701/584442.html 1.修改springweb类bug 2.数据库连接配置 3.数据库字符集 https://w ...

  4. 常见字符集&乱码问题

    字符集 常用字符集分类 ASCII及其扩展字符集 作用:表语英语及西欧语言. 位数:ASCII是用7位表示的,能表示128个字符:其扩展使用8位表示,表示256个字符. 范围:ASCII从00到7F, ...

  5. MySQL字符集乱码

    学数据库,最让人丧气的就是字符集的问题了,一旦出问题,就会有砸电脑的冲动,特别是在修改很多次字符集后依然不成功的时候! 我用的数据库软件是MySQL 5.1.28.最初出问题的时候,是这样的: 情景一 ...

  6. 字符集乱码问题:ISO-8859-1和GBK

    问题,引用百度知道的问题吧: http://zhidao.baidu.com/question/51342167.html?qbl=relate_question_0&word=%C3%84% ...

  7. mysql字符集乱码问题

    程序错误截图如下: 分析:我们mysql数据库没有设置默认编码, 导致创建的库字符集为 latin1,然而我们创建表的时候,指定字符集为其他的,比如utf8 我的解决思路:把数据库的编码修改为utf8 ...

  8. Python 爬虫 字符集乱码问题

    解决办法: http://worldant.blog.sohu.com/251745784.html 爬虫爬下来的源代码和网页的源代码不一样,可以先把爬下来的代码输出或保存在文件中,然后再写正则匹配表 ...

  9. MYSQL 解决中文字符集乱码问题的方法

    修改 /etc/mysql/my.cnf 增加内容 [client] default-character-set = utf8mb4 [mysql] default-character-set = u ...

随机推荐

  1. ABP之N层架构

    介绍 应用程序代码库的分层是一种广泛接受的技术,有助于降低复杂性并提高代码的可重用性. 为了实现分层体系结构,ASP.NET Boilerplate遵循领域驱动设计(DDD)的原则. 领域驱动设计(D ...

  2. day08(字符编码,字符与字节,文件操作)

    一,复习 ''' 类型转换 1.数字类型:int() | bool() | float() 2.str与int: int('10') | int('-10') | int('0') | float(' ...

  3. 【刷题】【LeetCode】总

    参考资料 用动画的形式呈现解LeetCode题目的思路 目录: 000-十大经典排序算法 001-两数之和-easy 暴力法(遍历):两遍哈希表:一遍哈希表 002- 003- 004- 005- 0 ...

  4. python-itchat 统计微信群、好友数量的实例

    今天小编就为大家分享一篇python-itchat 统计微信群.好友数量,及原始消息数据的实例,具有很好的参考价值,希望对大家有所帮助.一起跟随小编过来看看吧   效果:   好友: # 获取自己的用 ...

  5. 结构体中.和->两种访问区别

    定义结构体指针,访问成员时就用->定义结构体变量,访问成员时就用. 例如:struct A { int a; char b;}; struct A q; 访问成员就用:q.a;struct A ...

  6. 文本编辑利器Notepad++ 10个强大而又鲜为人知的特性【转】

    文本编辑利器Notepad++ 10个强大而又鲜为人知的特性 - 为程序员服务

  7. xgboost-Python&R

    sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003& ...

  8. Hadoop大数据通用处理平台

    1.简介 Hadoop是一款开源的大数据通用处理平台,其提供了分布式存储和分布式离线计算,适合大规模数据.流式数据(写一次,读多次),不适合低延时的访问.大量的小文件以及频繁修改的文件. *Hadoo ...

  9. python 生产者 --- 消费者

    值得拿出来 看看的 多进程 爬取 (生产) , 解析 (消费) 网页 同时进行,可以作为以后项目扩展使用 from bs4 import BeautifulSoup import requests i ...

  10. GDB调试技巧:总结篇

    目录 一 写在开头 1.1 本文内容 二 学习资料 三 常用命令 四 调试技巧 注:原创不易,转载请务必注明原作者和出处,感谢支持! 一 写在开头 1.1 本文内容 总结GDB调试的一些常用命令和调试 ...