mysql字符集编码乱码测试如下
创建三个表tb_latin1,tb_utf8,tb_gbk,编码分别为latin1/utf8/gbk
“你好a”字符串编码如下
GBK : %C4%E3 %BA%C3 %61
UTF-8 : %E4%BD%A0 %E5%A5%BD %61
测试代码如下
<?php
//fileencoding=gb2312
mysql_query("set names gbk");
mysql_query("insert into test.tb_latin values('gbk', '你好a')");
/*
连接的字符集是GBK,一个字符由一到两个字节表示,传入 %C4%E3 %BA%C3 %61
存储的字符集是latin1,一个字符由一个字节表示 mysql将传入的三个字符转换为latin1的三个字符变成 %3F(找不到对应的转换对应表表) %3F %61 导致数据存储错误(??a) (存储占用3字节)
*/
mysql_query("insert into test.tb_utf8 values('gbk', '你好a')");
/*
连接的字符集是GBK,一个字符由一到两个字节表示,传入 %C4%E3 %BA%C3 %61
存储的字符集是utf8,一个字符由一到四个字节表示 mysql将传入的三个字符转换为utf8的三个字符变成 %E4%BD%A0 %E5%A5%BD %61(存储占用7字节) 读取时连接设置为UTF-8和GB2312都可以,但指定为latin1会出现转码失败返回错误内容(??a)
UTF-8返回7字节,GB2312返回5字节
*/
mysql_query("insert into test.tb_gbk values('gbk', '你好a')");
/*
连接的字符集是GBK,一个字符由一到两个字节表示,传入 %C4%E3 %BA%C3 %61
存储的字符集是GBK,保存为 %C4%E3 %BA%C3 %61 存储占用5字节 读取时连接设置为UTF-8和GB2312都可以,但指定为latin1会出现转码失败返回错误内容(??a)
UTF-8返回7字节,GB2312返回5字节
*/
?>
<?php
//fileencoding=gb2312
mysql_query("set names latin1");
mysql_query("insert into test.tb_latin values('gblatin1', '你好a')");
/*
连接的字符集是latin1,一个字符由一个字节表示,传入 %C4 %E3 %BA %C3 %61
存储的字符集是latin1,一个字符由一到四个字节表示,存储为 %C4 %E3 %BA %C3 %61 (存储占用5字节) 读取时连接编码为latin1,前端获取五个字符(%C4 %E3 %BA %C3 %61)
如果vim(term)环境如果正好是gb2312编码环境则显示文本“你好a”
如果vim(term)显示环境编码为latin1,显示(乱码)
如果vim(term)语言环境为utf8,转码(由latin1转UTF8)会失败显示(???a)
读取时连接为gbk,mysql无法将五个字符转成5个相应的gbk编码,返回(????a)错误内容
读取时连接为utf8,mysql将五个字符转换为 %C3%84 %C3%A3 %C2%BA %C3%83 %61 错误内容,具体呈现看term编码
*/
mysql_query("insert into test.tb_utf8 values('gblatin1', '你好a')");
/*
连接的字符集是latin1,一个字符由一个字节表示,传入 %C4 %E3 %BA %C3 %61
存储的字符集是utf8,一个字符由一个字节表示,存储为 %C3%84 %C3%A3 %C2%BA %C3%83 %61 (存储占用5字节) 读取时连接编码为latin1,前端获取五个字符(%C4 %E3 %BA %C3 %61) (mysql把错误的编码转为latin1)
如果vim(term)环境如果正好是gb2312编码环境则显示文本“你好a”
如果vim(term)显示环境编码为latin1,显示(乱码)
如果vim(term)语言环境为utf8,转码(由latin1转UTF8)会失败显示(???a)
读取时连接为gbk,mysql无法将五个字符转成5个相应的gbk编码,返回(????a)错误内容
读取时连接为utf8,mysql将五个字符转换为 %C3%84 %C3%A3 %C2%BA %C3%83 %61 错误内容,具体呈现看term编码
*/
mysql_query("insert into test.tb_gbk values('gblatin1', '你好a')");
/*
连接的字符集是latin1,一个字符由一个字节表示,传入 %C4 %E3 %BA %C3 %61
存储的字符集是gbk,一个字符由一到两个字节表示,mysql无法将五个字符转成5个相应的gbk编码,存储(????a)错误内容
*/
?>
<?php
//fileencoding=utf8
mysql_query("set names utf8");
mysql_query("insert into test.tb_latin1 values('utf8', '你好')");
/*
连接的字符集是UTF-8,一个字符由一到四个字节表示,传入 %E4%BD%A0 %E5%A5%BD %61
存储的字符集是latin1,一个字符由一个字节表示 mysql将传入的三个字符转换为latin1的三个字符变成 %3F(找不到对应的转换对应表表) %3F %61 导致数据存储错误(??a) (存储占用3字节)
*/
mysql_query("insert into test.tb_utf8 values('utf8', '你好')");
/*
连接的字符集是UTF-8,一个字符由一到四个字节表示,传入 %E4%BD%A0 %E5%A5%BD %61
存储的字符集是utf8,一个字符由一到四个字节表示,存储 %E4%BD%A0 %E5%A5%BD %61 读取时连接设置为UTF-8和GB2312都可以,但指定为latin1会出现转码失败返回错误内容(??a)
UTF-8返回7字节,GB2312返回5字节
*/
mysql_query("insert into test.tb_gbk values('utf8', '你好')");
/*
连接的字符集是UTF-8,一个字符由一到四个字节表示,传入 %E4%BD%A0 %E5%A5%BD %61
存储的字符集是GBK,保存为 %C4%E3 %BA%C3 %61 存储占用5字节 读取时连接设置为UTF-8和GB2312都可以,但指定为latin1会出现转码失败返回错误内容(??a)
UTF-8返回7字节,GB2312返回5字节
*/
?>
<?php
//fileencoding=utf8
mysql_query("set names latin1");
mysql_query("insert into test.tb_latin values('latin1', '你好')");
/*
连接的字符集是latin1,一个字符由一个字节表示,传入 %E4 %BD %A0 %E5 %A5 %BD %61
存储的字符集是latin1,一个字符由一个字节表示,存储为 %E4 %BD %A0 %E5 %A5 %BD %61 (存储占用7字节) 读取时连接编码为latin1,前端获取七个字符(%E4 %BD %A0 %E5 %A5 %BD %61)
如果vim(term)环境如果正好是UTF8编码环境则显示文本“你好a”
如果vim(term)显示环境编码为latin1,显示(乱码)
如果vim(term)语言环境为gbk,乱码
读取时连接为gbk,mysql无法将七个字符转成对应的七个相应的gbk编码,返回(??????a)错误内容
读取时连接为utf8,mysql将七个字符转换为 %c3%a4 %c2%bd %c2%a0 %c3%a5 %c2%a5 %c2%bd %61 内容返回(显示错误)
*/
mysql_query("insert into test.tb_utf8 values('latin1', '你好')");
/*
连接的字符集是latin1,一个字符由一个字节表示,传入 %E4 %BD %A0 %E5 %A5 %BD %61
存储的字符集是utf8,一个字符由一个到四个字节表示,存储为 %c3%a4 %c2%bd %c2%a0 %c3%a5 %c2%a5 %c2%bd %61 (存储占用13字节,业务侧需转为latin1方可显示正确内容) 读取时连接编码为latin1,前端获取五个字符(%E4 %BD %A0 %E5 %A5 %BD %61) (mysql把13个字节的7个字符转为latin1)
如果vim(term)环境如果正好是utf8编码环境则显示文本“你好a”
如果vim(term)显示环境编码为latin1,显示(乱码)
如果vim(term)语言环境为gbk,乱码
读取时连接为gbk,mysql无法将7个字符转成7个相应的gbk编码,返回(??????a)错误内容
读取时连接为utf8,mysql将五个字符转换为 %c3%a4 %c2%bd %c2%a0 %c3%a5 %c2%a5 %c2%bd %61 错误内容,具体呈现看term编码
*/
mysql_query("insert into test.tb_gbk values('latin1', '你好')");
/*
连接的字符集是latin1,一个字符由一个字节表示,传入 %E4 %BD %A0 %E5 %A5 %BD %61
存储的字符集是gbk,一个字符由一到两个字节表示,mysql无法将7个字符转成7个相应的gbk编码,存储(??????a)错误内容
*/
?>
数据库查询如下
mysql> select charset, data,length(data) from tb_latin;
+----------+---------+--------------+
| charset | data | length(data) |
+----------+---------+--------------+
| gbk | ??a | 3 |
| gblatin1 | ????a | 5 |
| utf8 | ??a | 3 |
| latin1 | ??????a | 7 |
+----------+---------+--------------+
4 rows in set (0.00 sec) mysql> select charset, data,length(data) from tb_utf8;
+----------+---------+--------------+
| charset | data | length(data) |
+----------+---------+--------------+
| gbk | ???a | 7 |
| gblatin1 | ????a | 9 |
| utf8 | ???a | 7 |
| latin1 | ??????a | 13 |
+----------+---------+--------------+
4 rows in set (0.00 sec) mysql> select charset, data,length(data) from tb_gbk;
+----------+---------+--------------+
| charset | data | length(data) |
+----------+---------+--------------+
| gbk | ???a | 5 |
| gblatin1 | ????a | 5 |
| utf8 | ???a | 5 |
| latin1 | ??????a | 7 |
+----------+---------+--------------+
附测试代码如下:
<?php
//...
mysql_query("set names latin1");
$result=mysql_query("SELECT * FROM test.tb_gbk where charset='latin1'");
while($row=mysql_fetch_row($result))
{
var_dump($row);
echo bin2hex($row[1]);
}
?>
<?php $a="%c3%a4%c2%bd%c2%a0%c3%a5%c2%a5%c2%bd%61";
$b = urldecode($a);
var_dump(bin2hex($b));
$c = iconv("UTF-8","latin1",$b);
var_dump(bin2hex($c)); ?>
mysql字符集编码乱码测试如下的更多相关文章
- MySQL字符集编码
MySQL字符集编码总结 之前内部博客上凯哥分享了一篇关于mysql字符集的文章,之前我对mysql字符集一块基本没有深究过,看到凯哥文章后有些地方有点疑惑,遂自己去看了mysql的官方文档,并參考了 ...
- 从一个慢查询到MySQL字符集编码
从一个慢查询到MySQL字符集编码 目录 从一个慢查询到MySQL字符集编码 1. 问题起源 2. MySQL字符集和字符集排序规则 2.1 字符集相关概念 2.2 MySQL中的字符集和字符集排序规 ...
- MySQL字符集编码相关
Windows 10家庭中文版,MySQL 5.7.20,2018-05-07 Part.1 查找数据库的字符集编码 查看MySQL字符集编码:status命令 使用命令行登录MySQL服务器,然后 ...
- MySQL从删库到跑路(二)——MySQL字符集与乱码解析
作者:天山老妖S 链接:http://blog.51cto.com/9291927 一.字符集与编码 1.字符集简介 字符(Character)是各种文字和符号的总称,包括各国家文字.标点符号.图形符 ...
- java字符集编码乱码问题
博客分类: web javajspservlet 最近做网页这块时碰到了正文字符乱码问题.别看这小小的一个问题,对我来说却花费了好长一段时间.现在让我慢慢分析它吧(说实话.这些有部分是从网上找的,但 ...
- MySQL字符集编码的理解分析
今天帮同事处理一个棘手的事情,问题是这样的: 无论在客户机用哪个版本的mysql客户端连接服务器,发现只要服务器端设置了 character-set-server = utf8之后, characte ...
- linux下mysql字符集编码问题的修改
安装完的MySQL的默认字符集为 latin1 ,为了要将其字符集改为用户所需要的(比如utf8),就必须改其相关的配置文件:由于linux下MySQL的默认安装目录分布在不同的文件下:不像windo ...
- mysql 查看编码方式
一. 查看数据库的字符集 show variables like 'character\_set\_%'; 输出: +--------------------------+--------+ | Va ...
- Mysql查看编码方式
查看数据库的字符集 show variables like 'character\_set\_%'; 输出: +--------------------------+--------+ | Varia ...
随机推荐
- 欧几里得求最大公约数--JAVA递归实现
欧几里得算法求最大公约数算法思想: 求p和q的最大公约数,如果q=0,最大公约数就是p:否则,p除以q余数为r,p和q的最大公约数即q和r的最大公约数. java实现代码: public class ...
- Qt for Android遇到的几个错误解决[Win7 + Qt5.6 +jdk 8u91]
[1]SDK Manager无法更新Android SDK安装后需要运行SDK Manager下载安装包,默认从google网站下载,但被GWF和谐了,感谢一位网友提供的镜像站点.具体步骤是:运行SD ...
- javascript函数值的重写
原文:javascript函数值的重写 javascript函数值的重写 定义了一个函数,需要重写这个函数并使用原先的函数值.做法是: 1.定义一个变量让原先函数的值指向它,把原先函数的指向一个新的函 ...
- C4.5较ID3的改进
1.ID3选择最大化Information Gain的属性进行划分 C4.5选择最大化Gain Ratio的属性进行划分 规避问题:ID3偏好将数据分为很多份的属性 解决:将划分后数据集的个数考虑 ...
- 批处理就是windows的杰作啊
今天要为了解决vs不能同时开启调试和编写的问题,我就上网查找了一些批处理的命令,用批处理调用exe,和打开txt,虽然一行代码就解决了但是我没用过啊,很陌生. call 路径\a.exe 就相当于 ...
- jquery单页网站导航插件One Page Nav
这是一个轻量级的jQuery的单页网站导航插件.增加了单击后平滑滚动导航和当你浏览不同的部分时自动选择正确的导航项. changeHash: false, 改变当用户单击导航,就改变changeHas ...
- ajax相关
Javascript·部分: <script language="javascript" type="text/javascript" src=" ...
- java.lang.IllegalStateException: Target host must not be null, or set in parameters. scheme=null, host=null, path=Aict/listPagedAict.action
原因:请求的URL地址不完整,没有找到host. 排查解决:发现HTTP请求的URL少加了项目名,导致URL地址不完整.
- Weblogic 部署注意事项
Weblogic下部署服务注意事项: 1. 解决weblogic与hibernate的jar包冲突问题: 首 先找到该系统的DOMAIN_HOME(即你所建的域所在的位置)如:域empi的DOMAIN ...
- C++自定义命名空间
关于C++自定义命名空间,今天验证了一下命名空间如何使用,和嵌套命名空间以及出现的bug. 如何自定义命名空间,实例如下: insertion_sort.h和insertion_sort.cpp #p ...