Transfer-Encoding：chunked 返回数据过长导致中文乱码

最近在写一个项目的后台时，前端请求指定资源后，返回JSON格式的数据，突然发现在返回的字节数过大时，最后的message中文数据乱码了，对于同一个接口的请求：当数据小时不会乱码，当数据量大了中文就乱码了。

基本的Controller代码如上，有的人也许一眼发现了问题所在，有人会质疑我的写法，但是在这里我想找的不是这个。

对于这个情况，在抓包后得到的状况如下：（记住大概你觉得陌生的地方，继续往下看）

可以明显的观察到，这里在中文乱码时出现了更多的TCP数据报。

到了抓包的地方，我们就可以观察到HTTP响应头发生了变化，在正常状态下，会返回Content-Length，但是在数据很多，即中文乱码的情况下，Content-Length属性被Transfer-Encoding:chunked属性取代了。

一开始想修改一下Chrome浏览器的编码试试，但是发现在Chrome
55之后的版本，字符集编码的修改功能被移除了。按照Google方面的说法如下：

大概就是，自动检查分析字符集的功能虽然使出现乱码的情况减少，但是拖慢了页面加载时间大概10%~20%；选择功能同时会在页面已经声明其编码的情况下有几率地，使用户因为自己设置的编码而看到乱码，所以页面声明编码时，直接调用选择，否则，默认使用Chrome的UI语言。

当不能预先确定报文体的长度时,或是报文长度过长时，无法使用Content-Length来指明报文体长度，此时就需要通过Transfer-Encoding域来代替。

Transfer-Encoding：chunked用于http传送过程的分块传输技术，原因是http服务器响应的报文长度经常是不可预测的，使用Content-length的实体搜捕并不是总是管用。
分块技术的意思是说，实体被分成许多的块（Data
chunk），也就是应用层的数据，TCP在传送的过程中，不对它们做任何的解释，而是把应用层产生数据全部理解成二进制流，然后按照一定的长度切成一段的，然后一次性给TCP协议去传输，而具体这些二进制的数据如何做解释，需要应用层来完成，所以在这之前，一快整体应用层的数据需要等它分成的所有TCP
segment到达对方，重新组装后，应用程序才使用自己的解码方法还原它们。

分块传输时，我们设置的CharacterEncoding无效了，其实当Transfer-Encoding时，编码格式就是它的值——chunked，采用chunked编码方式来进行报文体的传输，基本方法是将大块数据分解成多块小数据，每块都可以自指定长度。chunked编码是HTTP/1.1
RFC里定义的一种编码方式，因此所有的HTTP/1.1应用都应当支持此方式。

chunked编码格式在RFC中定义如下：

chunked编码为了分块传输数据，将一个数据信息分成多个有自己长度的块，这样就允许在不知道长度的情况下动态的去传输数据信息，Chunked-Body分块由CRLF（回车换行符）进行分隔，包含有一个16进制的长度size信息和一个数据为“0”的chunk块来表示数据传输完毕。

写了这么多，如果我们回头看就会发现一些对应的HTTP报文，以及问题的根源！

好吧…对于最后，记得在返回JSON时中加入代码段取代简单的设置字符集：

这是我失误的地方，字符集的指定最后还是被chunk给打败了，也许是优先级不够吧，但是也学到了很多东西。

Transfer-Encoding：chunked 返回数据过长导致中文乱码的更多相关文章

读取 properties 配置文件含有中文的value内容导致中文乱码的解决办法
1.前言因为装系统的时候把中文写在了系统路径,现在我想把这个路径写在properties里面来读取,可是发现java 读取会导致中文乱码成问号????的乱码 ,百度找了好多博客,基本都是一摸一 ...
js ajax post提交 ie和火狐、谷歌提交的编码不一致，导致中文乱码
今天遇到一个问题找了很久发现: 使用js ajax post提交 ie和火狐.谷歌提交的编码不一致,导致中文乱码 //http://www.cnblogs.com/QGC88 $.ajax({ url ...
[Done]SnowFlake生成Long类型主键返回前台过长导致精度缺失的问题
问题描述: 在开发过程中,项目的主键生成器是SnowFlake,其生成的long主键是28位, 但是js中Long的最大值:https://blog.csdn.net/sunmerZeal/artic ...
中小学教育缴费----支付宝回传数据.net core 接收中文乱码
问题描述: 中小学教育缴费,发送账单到家长支付宝,家长支付成功之后,支付宝回传数据,验签的时候失败了,排查之后发现账单名称乱码了.支付宝回传的时候中文传的是GBK编码格式,但是我接收的是%D5˵%A5 ...
MySQL对JSON类型UTF-8编码导致中文乱码探讨
前言继上文发表之后,结合评论意见并亲自验证最终发现是编码的问题,但是对于字符编码还是有点不解,于是乎,有了本文,我们来学习字符编码,在学习的过程中,我发现对于MySQL中JSON类型的编码导致数据中 ...
使用Kettle抽取数据时，出现中文乱码问题解决方案
使用Kettle在不同的数据库抽取数据时,有时会出现中文乱码问题:其解决方案如下: 1.查看数据库的字符集是否是UTF-8(最常用的字符集) 2.如果数据库设置正确仍然存在中文乱码,则可能是因为有的客 ...
关于hibernate插入数据到mysql数据库中文乱码问题的解决
要想解决这个问题就要找到问题的症结所在 1.首先将数据提交到action输出看action里的数据是不是中文乱码,结果很遗憾并不是这里的问题 2.设置数据库连接url: 3.打开mysql安装文件里的 ...
前台get传递含中文数据到后台出现中文乱码
博客:(前后台文件编码相同)前台传后台中文乱码 4月4日补充 jsp页面第一句没有下面一句或者页面发布后查看源代码时第一句已经不在了 <%@ page language="java&q ...
JMeter_响应数据为空以及中文乱码
一.响应数据为空最近做测试接口,使用同样的请求方式.地址.参数和header,在postman中能正常响应,接收数据的也正常,但是在Jmeter中,虽然响应正常,但是响应数据却为空! Jmeter接 ...

随机推荐

激活xmind的方法
https://blog.csdn.net/qq_38238041/article/details/81107127 这里以windows为例来演示,其它操作系统需根据情况修改相应步骤. 下载安装包 ...
Mybatis 的输入参数学习
mybatis 的输入参数: 指得就是parameterType的参数这个参数就代表的sql语句中的输入参数 sql语句中的参数使用有两种方式 : 使用#{} 获取: 8个基本数据类型 + S ...
Linux中tail指令详解
linux tail命令用途是依照要求将指定的文件的最后部分输出到标准设备,通常是终端,通俗讲来,就是把某个档案文件的最后几行显示到终端上,假设该档案有更新,tail会自己主动刷新,确保你看到最新的档 ...
jquery input 实时监听输入
$('input').bind('input propertychange', function() { alert('hello world') });
jQuery入门讲解
jQuery设计思想: (1)选择页面元素 css选择器: $(document) 选择整个文档对象, $("#myId") 选择id为myId的页面元素, $("div ...
tf入门-tf.nn.conv2d是怎样实现卷积的？
转自:https://blog.csdn.net/mao_xiao_feng/article/details/78004522 实验环境:tensorflow版本1.2.0,python2.7 介绍 ...
String 源码浅析————终结篇
写在前面说说这几天看源码的感受吧,其实 jdk 中的源码设计是最值得进阶学习的地方.我们在对 api 较为熟悉之后,完全可以去尝试阅读一些 jdk 源码,打开 jdk 源码后,如果你英文能力稍微过得 ...
maven项目在eclipse启动报错：java.lang.ClassNotFoundException
问题: 用eclipse创建maven项目的时候,pom.xml中相关的依赖jar已经导入进去,还会报java.lang.ClassNotFoundException的错误,提示找不到相关的jar包, ...
FlowPortal-BPM——文件目录功能
安装目录文件夹:Attachments 附件bin Bin目录:dll文件的引用DataSourceProviders 固定的数据库连接文件ExtServer 数据源服务FormService 表单服 ...
Python pip离线部署
因为生产环境不能联网,必须使用离线部署pip包,倒也不用部署Pypi镜像那么大工作量,其实蛮简单的,贴出了备忘 pip download -r requirements.txt -d packages ...

Transfer-Encoding：chunked 返回数据过长导致中文乱码

Transfer-Encoding：chunked 返回数据过长导致中文乱码的更多相关文章

随机推荐

热门专题