深入理解Java和MySQL乱码问题
近期我们使用tomcat和MySQL搭建了一个Java Webserver,并将游戏的server逻辑部署在该server上。
游戏上线后不久,我们发现数据库中出现了大量的乱码。这是个很严重的问题,因此必须立即解决。可是问题出在什么地方呢,依据分析,乱码仅仅可能出如今两个时间点:
1. 将数据从client传送到server的时候。
2. server将数据存储到数据库的时候。
经过调试之后,我们发现server输出的数据是正常的,因此乱码问题仅仅能发生在存储入库的时候。
既然是MySQL数据库编码的问题,那事情就相对好办了,首先,输入命令:
mysql>show variables like '%char%';
+--------------------------+----------------+
|Variable_name | Value |
+--------------------------+----------------+
|character_set_client | utf8 |
| character_set_connection| utf8
|
|character_set_database | latin1 |
|character_set_filesystem | binary |
|character_set_results | utf8 |
|character_set_server | latin1 |
|character_set_system | utf8 |
+--------------------------+----------------+
上述命令用于显示当前MySQL用到的数据库编码。当看到这么多项数据编码之后,脑袋都有点大,没办法,仅仅能硬着头皮一个一个地把这些參数搞明确。
l character_set_server:创建数据库时,假设没有指定字符编码,那么系统将使用character_set_server的值作为默认值。
l character_set_database:创建表时,假设没有指定字符编码,那么系统将使用character_set_database的值作为默认值。
l character_set_client:定义了MySQL客户端所发送数据的编码。
l character_set_connection:当MySQLserver接收到client发送过来的数据之后,会将这些数据转化成character_set_connection所指定的编码。
l character_set_results:MySQLserver返回查询结果所使用的字符编码。
知道这些參数的含义之后,就没有那么茫然无助了,因此脑海中回想下数据存储入库的过程。
通过MySQLclient运行插入的步骤例如以下,MySQLclient将用户输入的数据编码成character_set_client,发送到server,server接收到之后,将其转化成character_set_connection,然后server再将这些数据存储成character_set_table(上面这些參数不包括这个,即假设建表时没有指定,该值即为character_set_database)。
回顾一下,发现当时建表的时候并没有主动在建表语句后面指定字符编码,那么依据上面的描写叙述,数据库的表就会使用character_set_database所指定的字符编码,即latin1。因为UTF-8编码的中文无法存储成latin1,因此在往latin1编码的表中存储UTF-8编码的中文时,数据库会将无法识别的字符变成?,而且这个过程是不可逆的。
为了证明这一点,我试着通过MySQLclient往表中插入中文,结果插入失败。因此我决定将表的字符编码改动成UTF-8,看看能否往表中插入中文,运行例如以下语句之后:
mysql> ALTER TABLE `tableName` DEFAULTCHARACTER SET utf8 COLLATE utf8_general_ci
表的字符编码被改动成了UTF-8,这时候发现也能往表中插入中文了。
当时以为事情到这里就结束了,但是当我们启动tomcat进行測试之后,发现数据库中存入的依旧是乱码。既然MySQLclient都能插入中文,为啥使用JDBC就不能呢?非常有可能JDBC并不使用character_set_client来编码client数据。
翻阅了无数文档之后,发现假设不在JDBC URL中通过characterEncoding属性指定连接编码,JDBC Driver会使用character_set_server作为连接的编码,在本案例中,即使用latin1。既然原因找到了,那问题就比較好攻克了。
将JDBC URL改动成jdbc:mysql://localhost/some_db?useUnicode=yes
&characterEncoding=UTF-8就可以,假设使用的是tomcat数据源,那么记得把’&’替换成’&’。
最后,当再次启动server时,发现数据库中最终出现了正确的字符。
深入理解Java和MySQL乱码问题的更多相关文章
- 10分钟学会理解和解决MySQL乱码问题
在阅读本文之前,强烈建议对字符集编码概念还比较模糊的同学 阅读下博主之前对相关概念的一篇科普:十分钟搞清字符集和字符编码 本博客已经迁移至: http://cenalulu.github.io/ 为了 ...
- 理解和解决MySQL乱码问题【转】
本文来自:http://www.cnblogs.com/cenalulu/p/4325693.html 要了解为什么会出现乱码,我们就先要了解从客户端发起请求,到MySQL存储数据,再到下次从表取回客 ...
- 理解和解决MySQL乱码问题
本文将详细介绍MySQL乱码的成因和具体的解决方案 在阅读本文之前,强烈建议对字符集编码概念还比较模糊的同学 阅读下博主之前对相关概念的一篇科普:十分钟搞清字符集和字符编码 MySQL出现乱码的原因 ...
- 41、java与mysql乱码的问题
解决方法一:(最重要的一种方法)你看下my.ini,有无 [MySQL] default-character-set=utf8 [client] default-character-set=utf8 ...
- 【转载】10分钟学会理解和解决MySQL乱码问题
原文地址:http://cenalulu.github.io/mysql/mysql-mojibake/ 原文作者:Junyi Lu,卢钧轶 / cenalulu / Luke 查看原文.
- MySQL乱码问题(为什么?追根溯源)
引言 定位:查询数据库得到的结果集乱码,client端向数据库插入数据乱码. 网上有不少帖子,手把手地教给我们如何去改这一问题.方案大多数如下: 方案中最多介绍的就是更改配置文件,win下my.ini ...
- Java连接MySQL中文乱码处理【转载】
本文转载地址:http://developer.51cto.com/art/200906/130425.htm 感谢相关作者! MySQL默认编码是latin1 mysql> show vari ...
- sql点滴40—mysql乱码问题总结
原文:sql点滴40-mysql乱码问题总结 本文将为大家讲解如何处理Java连接过程中的MySQL中文乱码问题.一般MySQL中文乱码问题都是与字符集有关,这里作者的经历也大致差不多. MySQL默 ...
- Java连接MySQL数据库增删改查通用方法
版权声明:本文为博主原创文章,未经博主允许不得转载. Java连接MySQL数据库增删改查通用方法 运行环境:eclipse+MySQL 以前我们Java连接MySQL数据库都是一个数据库写一个类,类 ...
随机推荐
- hdu2029
http://acm.hdu.edu.cn/showproblem.php?pid=2029 #include<stdio.h> #include<string.h> #inc ...
- python之set集合及深浅拷贝
一.知识点补充 1.1字符串的基本操作 li =["李李嘉诚", "麻花藤", "⻩黄海海峰", "刘嘉玲"] s = ...
- 最新省市区划分码code
爬取国家统计局省市区code 提供php爬取脚本以及json和sql https://github.com/zzDylan/area-code 觉得好用给个star,3q
- C#用Microsoft.Office.Interop.Word进行Word转PDF的问题
之前用Aspose.Word进行Word转PDF发现'\'这个字符会被转换成'¥'这样的错误,没办法只能换个方法了.下面是Microsoft.Office.Interop.Word转PDF的方法: p ...
- Win32最简单的程序
#include<tchar.h> #include<stdio.h> #include<windows.h> LRESULT CALLBACK WinSunPro ...
- 01--Java开发中文乱码问题分析
一.常见的编码格式 1. ASCII码 总共128个字符,用1个字节的低7位表示,0~31是控制字符,32~126是打印字符. 2. ISO-8859-1 ISO组织在ASCII基础上进行扩展,仍是 ...
- OpenCV:使用OpenCV3随机森林进行统计特征多类分析
原文链接:在opencv3中的机器学习算法练习:对OCR进行分类 本文贴出的代码为自己的训练集所用,作为参考.可运行demo程序请拜访原作者. CNN作为图像识别和检测器,在分析物体结构分布的多类识别 ...
- FTP工作原理
FTP工作原理 FTP两种传输方式:1.ASCII传输2.二进制传输 FTP主被动原理: 主动方式:1.用户与服务器建立控制通道2.客户端发出PORT指令,主动告诉服务器端口号3.服务器主动通过20端 ...
- 04 学习java养成良好的写作习惯
1, 驼峰命名法 首字母大写 2, 写的时候大小中括号都补全,不忘记分号 不要都放在一行上 3, 缩进对其,tab键 4, 严格要求自己,养成良好的写作风格 5, javadoc可以将文档注释,直接生 ...
- colgroup 整行变色
<table border="2" width="100%"> <colgroup span="2" align=&quo ...