近期我们使用tomcat和MySQL搭建了一个Java Webserver,并将游戏的server逻辑部署在该server上。

游戏上线后不久,我们发现数据库中出现了大量的乱码。这是个很严重的问题,因此必须立即解决。可是问题出在什么地方呢,依据分析,乱码仅仅可能出如今两个时间点:

1.       将数据从client传送到server的时候。

2.       server将数据存储到数据库的时候。

经过调试之后,我们发现server输出的数据是正常的,因此乱码问题仅仅能发生在存储入库的时候。

既然是MySQL数据库编码的问题,那事情就相对好办了,首先,输入命令:

mysql>show variables like '%char%';

+--------------------------+----------------+

|Variable_name              | Value            |

+--------------------------+----------------+

|character_set_client      | utf8              |

| character_set_connection| utf8     
        |

|character_set_database   | latin1            |

|character_set_filesystem | binary           |

|character_set_results     | utf8             |

|character_set_server      | latin1          |

|character_set_system      | utf8              |

+--------------------------+----------------+

上述命令用于显示当前MySQL用到的数据库编码。当看到这么多项数据编码之后,脑袋都有点大,没办法,仅仅能硬着头皮一个一个地把这些參数搞明确。

l   character_set_server:创建数据库时,假设没有指定字符编码,那么系统将使用character_set_server的值作为默认值。

l   character_set_database:创建表时,假设没有指定字符编码,那么系统将使用character_set_database的值作为默认值。

l   character_set_client:定义了MySQL客户端所发送数据的编码。

l   character_set_connection:当MySQLserver接收到client发送过来的数据之后,会将这些数据转化成character_set_connection所指定的编码。

l   character_set_results:MySQLserver返回查询结果所使用的字符编码。

知道这些參数的含义之后,就没有那么茫然无助了,因此脑海中回想下数据存储入库的过程。

通过MySQLclient运行插入的步骤例如以下,MySQLclient将用户输入的数据编码成character_set_client,发送到server,server接收到之后,将其转化成character_set_connection,然后server再将这些数据存储成character_set_table(上面这些參数不包括这个,即假设建表时没有指定,该值即为character_set_database)。

回顾一下,发现当时建表的时候并没有主动在建表语句后面指定字符编码,那么依据上面的描写叙述,数据库的表就会使用character_set_database所指定的字符编码,即latin1。因为UTF-8编码的中文无法存储成latin1,因此在往latin1编码的表中存储UTF-8编码的中文时,数据库会将无法识别的字符变成?,而且这个过程是不可逆的。

为了证明这一点,我试着通过MySQLclient往表中插入中文,结果插入失败。因此我决定将表的字符编码改动成UTF-8,看看能否往表中插入中文,运行例如以下语句之后:

mysql> ALTER TABLE `tableName` DEFAULTCHARACTER SET utf8 COLLATE utf8_general_ci

表的字符编码被改动成了UTF-8,这时候发现也能往表中插入中文了。

当时以为事情到这里就结束了,但是当我们启动tomcat进行測试之后,发现数据库中存入的依旧是乱码。既然MySQLclient都能插入中文,为啥使用JDBC就不能呢?非常有可能JDBC并不使用character_set_client来编码client数据。

翻阅了无数文档之后,发现假设不在JDBC URL中通过characterEncoding属性指定连接编码,JDBC Driver会使用character_set_server作为连接的编码,在本案例中,即使用latin1。既然原因找到了,那问题就比較好攻克了。

将JDBC URL改动成jdbc:mysql://localhost/some_db?useUnicode=yes

&characterEncoding=UTF-8就可以,假设使用的是tomcat数据源,那么记得把’&’替换成’&’。

最后,当再次启动server时,发现数据库中最终出现了正确的字符。

深入理解Java和MySQL乱码问题的更多相关文章

  1. 10分钟学会理解和解决MySQL乱码问题

    在阅读本文之前,强烈建议对字符集编码概念还比较模糊的同学 阅读下博主之前对相关概念的一篇科普:十分钟搞清字符集和字符编码 本博客已经迁移至: http://cenalulu.github.io/ 为了 ...

  2. 理解和解决MySQL乱码问题【转】

    本文来自:http://www.cnblogs.com/cenalulu/p/4325693.html 要了解为什么会出现乱码,我们就先要了解从客户端发起请求,到MySQL存储数据,再到下次从表取回客 ...

  3. 理解和解决MySQL乱码问题

    本文将详细介绍MySQL乱码的成因和具体的解决方案 在阅读本文之前,强烈建议对字符集编码概念还比较模糊的同学 阅读下博主之前对相关概念的一篇科普:十分钟搞清字符集和字符编码 MySQL出现乱码的原因 ...

  4. 41、java与mysql乱码的问题

    解决方法一:(最重要的一种方法)你看下my.ini,有无 [MySQL] default-character-set=utf8 [client] default-character-set=utf8 ...

  5. 【转载】10分钟学会理解和解决MySQL乱码问题

    原文地址:http://cenalulu.github.io/mysql/mysql-mojibake/ 原文作者:Junyi Lu,卢钧轶 / cenalulu / Luke 查看原文.

  6. MySQL乱码问题(为什么?追根溯源)

    引言 定位:查询数据库得到的结果集乱码,client端向数据库插入数据乱码. 网上有不少帖子,手把手地教给我们如何去改这一问题.方案大多数如下: 方案中最多介绍的就是更改配置文件,win下my.ini ...

  7. Java连接MySQL中文乱码处理【转载】

    本文转载地址:http://developer.51cto.com/art/200906/130425.htm 感谢相关作者! MySQL默认编码是latin1 mysql> show vari ...

  8. sql点滴40—mysql乱码问题总结

    原文:sql点滴40-mysql乱码问题总结 本文将为大家讲解如何处理Java连接过程中的MySQL中文乱码问题.一般MySQL中文乱码问题都是与字符集有关,这里作者的经历也大致差不多. MySQL默 ...

  9. Java连接MySQL数据库增删改查通用方法

    版权声明:本文为博主原创文章,未经博主允许不得转载. Java连接MySQL数据库增删改查通用方法 运行环境:eclipse+MySQL 以前我们Java连接MySQL数据库都是一个数据库写一个类,类 ...

随机推荐

  1. 【BZOJ3527】[ZJOI2014] 力(FFT)

    题目: BZOJ3527 分析: FFT应用第一题-- 首先很明显能把\(F_j\)约掉,变成: \[E_j=\sum _{i<j} \frac{q_i}{(i-j)^2}-\sum_{i> ...

  2. python导入包出错:ImportError: No module named XXXXX

    python中,每个py文件被称之为模块,每个具有__init__.py文件的目录被称为包.只要模块或者包所在的目录在sys.path中,就可以使用import 模块或import 包来使用. 如果想 ...

  3. Swift自适应布局(Adaptive Layout)教程

    通用的Storyboard 通用的stroyboard文件是通向自适应布局光明大道的第一步.在一个storyboard文件中适配iPad和iPhone的布局在iOS8中已不再是梦想.我们不必再为不同尺 ...

  4. jQuery中关于如何使用animate自定义动画

    动画 animate() 01.animate()方法的简单使用 有些复杂的动画通过之前学到的几个动画函数是不能够实现,这时候就是强大的animate方法了. 操作一个元素执行3秒的淡入动画,对比下一 ...

  5. [转]Linux下/proc目录简介

    1. /proc目录Linux 内核提供了一种通过 /proc 文件系统,在运行时访问内核内部数据结构.改变内核设置的机制.proc文件系统是一个伪文件系统,它只存在内存当中,而不占用外存空间.它以文 ...

  6. 使用Kettle增量抽取MongoDB数据实践

    需求: 增量抽取MongoDB数据并加载到MSSQL 由于不能使用关系型数据库的自定义SQL, 所以主要遇到的问题有: 增量时间的查询和参数控制 ETL的批次信息和调用参数的写入 第一个问题的解决如下 ...

  7. DOM对象之window

    window的属性 top:返回当前窗口的最顶层的先辈窗口 document:返回HTML文档对象 location:当前窗口的地址 self:返回对自身窗口的引用 parent:返回父窗口 如何引用 ...

  8. Windows 8 常见教程

    http://www.codeproject.com/Articles/439874/Web-service-on-Windows-Phone http://www.c-sharpcorner.com ...

  9. Cesium学习笔记(四)Camera ----http://blog.csdn.net/hobhunter/article/details/74909641

    Cesium 相机控制场景中的视野.操作相机的方法有很多,如旋转,缩放,平移和飞到目的地.Cesium具有默认的鼠标和触摸事件处理程序与相机进行交互,还有一个API以编程方式操纵相机. 我们可以使用该 ...

  10. 发布自己的nuget包

    1.先到www.nuget.org注册账户,然后在用户中心获取apikey 2.到https://dist.nuget.org/index.html下载最新的nuget.exe,放到你的项目根目录下 ...