作者：vivo 互联网安全团队- Gui Mingcheng

本文介绍了两种攻击者无需直接接触服务端即可攻击和影响用户行为的安全漏洞 —— Web缓存污染与请求走私。Web缓存污染旨在通过攻击者向缓存服务器投递恶意缓存内容，使得用户返回响应结果而触发安全风险。HTTP请求走私旨在基于前置服务器（CDN、反向代理等）与后置服务器对用户请求体的长度判断标准不一致的特性，构造能够被同一TCP连接中其它用户夹带部分恶意内容的攻击请求，从而篡改了受害者的请求与响应行为。两种漏洞均需要通过针对中间件的合理配置与业务接口的合理设计进行排查和防御。

一、Web 缓存污染攻击原理与场景

1.1 什么是缓存？

缓存技术旨在通过减少延迟来加速页面加载，还可以减少应用程序服务器上的负载。一些公司使用像Varnish这样的软件来托管他们自己的缓存，而其他公司选择依赖像Cloudflare这样的内容分发网络（CDN），缓存分布在世界各地。此外，一些流行的Web应用程序和框架（如Drupal）具有内置缓存。Web缓存污染关注的是CDN等前置服务端部署的缓存服务，还有其他类型的缓存，例如客户端浏览器缓存和DNS缓存，但它们不是本次研究的关注点。

1.2 缓存的工作机制？

由CDN等代理层服务器根据“缓存键”缓存用户请求对应的响应，并在某个请求再次到来时直接返回相应的响应包。例如如下场景中，红色字体标识了缓存服务器配置的缓存键内容，A用户访问服务端返回的结果后，B用户再次访问仅会取得缓存服务器中的内容，因为缓存服务器认为两者是同一个请求，无需再向业务服务端重新请求一次。

1.3 缓存污染具体是如何实现的？

当攻击者的请求中，缓存键和普通用户没有差别，而请求中其它部分存在可体现在响应包中的恶意内容或代码时，该响应被缓存后，其它请求了同一个正常缓存键对应接口的用户会直接得到攻击者提前交给缓存服务器缓存的恶意响应。

以下是一个简单的例子，业务某个接口存在逻辑：获取用户请求Host头的内容，拼接至响应包的js链接中作为访问域名。此时攻击者注入恶意域名hack.com，受害者访问缓存资源的时候得到的是和攻击者一样的响应结果。此时攻击者通过JavaScript代码几乎劫持了受害者在前端的所有信息和行为，具体的后果则由其中的恶意代码所决定，这与XSS的攻击后果是类似的。

Web缓存能够构造什么样的攻击，取决于在不破坏缓存键的同时，构造能够在响应中体现恶意行为的请求，例如业务逻辑对Host头中的值进行校验和请求，但没有校验端口号是否为443或80。此时可以构造请求使得响应跳转至1337端口，其它受害者对该接口的访问便不再可用：

拓展学习 —— 攻击者如何确定缓存键的覆盖范围？

首先需要确认是否存在缓存键：

HTTP头直接返回缓存的相关信息

观察动态内容的变化

返回时间的差异
特定的第三方缓存配置头

如何定位缓存键的覆盖范围：

对请求A改动一处成为请求B，各自响应有所差异。若请求B后得到A的缓存结果，则说明A、B的缓存键相同，也说明了改动之处并非缓存键。
改变请求A某处内容发送，响应cache头仍然在缓存计时，说明该处内容部分不为缓存键。反之，重新命中，则该处内容包含缓存键。
利用特定的头来查询缓存键，例如：Pragma: akamai-x-get-cache-key, akamai-x-get-true-cache-key。

二、Web缓存污染防御手段

2.1 禁用缓存配置

对缓存投毒的最强大防御办法就是禁用缓存。

对于一些人来说，这显然是不切实际的建议，但我推测很多网站开始使用Cloudflare等服务的目的是进行DDoS保护或简化SSL的过程，结果就是容易受到缓存投毒的影响，因为默认情况下缓存是启动的。如果对确定哪些内容是“静态”的足够确认，那么只对纯静态的响应进行缓存也是有效的。

2.2 避免从请求中直接获取输入放在响应中

一旦在应用程序中识别出非缓存键的输入，理想的解决方案就是彻底禁用它们。如果不能实现的话可以在缓存层中剥离该输入，或将它们添加到缓存键。建议使用Param Miner等审计应用程序的每个页面以清除非缓存键的输入。

三、HTTP请求走私攻击原理与场景

3.1 HTTP请求走私的基本原理

在RFC2616的第4.4节中，规定：如果收到同时存在Content-Length和Transfer-Encoding这两个请求头的请求包时，在处理的时候必须忽略Content-Length。但实际处理往往没有遵守该协议。HTTP请求的开头与结束标志可以通过Content-Length来决定，也可以通过声明的Transfer-Encoding: chunked对HTTP分组来决定。当前置服务器和后置服务器对HTTP请求开头和结束标志的判断处理标准不一致时，就可能导致攻击者前一个请求的后半部分在后置被认为是下一个请求的开头，从而出现HTTP走私漏洞。

根据前后置服务器的不同请求体长度判断组合模式，有以下攻击场景：

本质原因：

前后置服务器对请求体长度的判断标准存在Content-Length和Transfer-Encoding两种形式
前置服务器和后置服务器之间存在TCP连接重用，混杂多个用户的请求

3.2 Content-Length和Transfer-Encoding请求头如何制定请求体长度？

请求体中每个字符为一个字节的长度，换行符包含 \r 和 \n 两个字节长度，Content-Length标识请求体从开头到最后一个字符的总长度：

Content-Length

POST /search HTTP/1.1

Host: normal-website.com

Content-Type: application/x-www-form-urlencoded

Content-Length: 11

q=smuggling

请求体中每个字符为一个字节的长度，换行符包含 \r 和 \n 两个字节长度。每段请求内容分别由一行16进制长度值和一行内容本身所组成，例如“q=smuggling”长度为11（16进制：b），“q=smuggle”长度为9（16进制：9）。内容结束后，以 0 和两个换行符结束请求体：

Transfer-Encoding: chunked

POST /search HTTP/1.1

Host: normal-website.com

Content-Type: application/x-www-form-urlencoded Transfer-Encoding: chunked

b

q=smuggling

9

q=smuggle

0

[\r\n]

[\r\n]

3.3 HTTP请求走私如何攻击？

基于上面描述的5种前后置服务器不同的请求体长度判断模式，这里抽选其中的 CL-TE 和 TE-CL 模式进行举例：

CL - TE

此时，业务前置服务器取用户请求头中Content-Length的值为长度判断标准，后置服务器根据Transfer-Encoding: chunked解析请求体来判断请求体长度。

如下所示，攻击者构造的请求，前置服务器认为有6个字符，包含了 0 和两个换行以及 G。而后置服务器则根据Transfer-Encoding: chunked解析请求体，认为 0 和两个换行符已经是请求的结束标志，字符G被滞留在了TCP管道中。

此时同一个TCP连接中中，一个受害者的请求接踵而至，后置服务器便会将字符G拼接至其请求开头，从而使得受害者实际对业务请求了GGET方法。

TE - CL

与CL - TE类似，前置服务器先根据Transfer-Encoding: chunked放行攻击者的整个请求体，经过后置服务器对Content-Length的判断，分割前半部分请求体给业务服务端，后半部分由受害者承接。

可以看到，这里攻击者完全可以劫持受害者的请求，从接口地址到请求头以及请求参数，因此具有较大的危害性。

3.4 HTTP请求走私攻击的效果是什么？

这里举一个例子 —— 捕获其他用户的请求。攻击者发现业务存在HTTP请求走私漏洞，同时又找到了评论接口 /post/comment 这种可以回显请求内容的功能点。那么攻击者就可以走私一个 /post/comment 的评论请求，从而让受害者“被迫”以这个请求去访问服务端。受害者的请求则被拼接到评论请求中的comment参数后，作为请求内容而出现。

攻击者去查看评论区，发现受害者已经将自己先前的请求（连同Cookie等信息）一并发送到了评论区。

踩坑记录

这里受害者的请求中一旦出现 “&” 字符，就会被当做 POST BODY的参数分隔符从而中止comment评论内容参数的解析。因此评论区仅能看到受害者请求中第一个 “&” 字符之前的内容。

四、HTTP请求走私防御手段

4.1 通用防御措施

禁用代理服务器与后端服务器之间的TCP连接重用。
使用HTTP/2能够避免请求边界判定标准不一致的问题。
前后置服务器使用同样的web服务器程序，保证对请求边界的判断标准是一致的。

4.2 实际问题

以上的措施有的不能从根本上解决问题，而且有着很多不足，就比如禁用代理服务器和后端服务器之间的TCP连接重用，会增大后端服务器的压力。使用HTTP/2在现在的网络条件下根本无法推广使用，哪怕支持HTTP/2协议的服务器也会兼容HTTP/1.1。从本质上来说，HTTP请求走私出现的原因并不是协议设计的问题，而是不同服务器实现的问题。因此要严格保证前后置服务器对请求边界的判断标准是一致的来防护该类型风险的出现。

五、实战演示

六、总结

Web缓存污染和HTTP请求走私是两种不太被关注到、但影响力和危害较大的两种安全漏洞类型。其共同点是均脱离业务应用本身，依托于严格规范的运维、网络人员的相关配置，因此在出现问题时对业务逻辑本身的排查往往会偏离实际情况。

Web缓存污染能够使攻击者批量影响共用了同一缓存资源的所有用户，HTTP请求走私能够使得攻击者随机在长连接中影响其他同时访问业务用户的请求内容，实际造成的影响取决于存在漏洞的接口和业务本身提供了多少能够利用的权限和功能。

因此，如果说有哪种漏洞能够在不直接攻击业务服务器和受害者电脑就能够实施大批量的攻击利用，从而影响到用户请求和收到的响应内容，则Web缓存污染和HTTP请求走私会是我们重点关注的核心风险问题。

非侵入式入侵 —— Web缓存污染与请求走私的更多相关文章

非侵入式JavaScript(Unobtrusive javaScript)理解
转载自 https://my.oschina.net/leegq/blog/279750 在Web的早期阶段,也就是在jQuery出现以前,在同一个文件中混杂JavaScript代码和HTML标记是非 ...
MVC的验证(模型注解和非侵入式脚本的结合使用) .Net中初探Redis .net通过代码发送邮件 Log4net (Log for .net) 使用GDI技术创建ASP.NET验证码 Razor模板引擎（RazorEngine） .Net程序员应该掌握的正则表达式
MVC的验证(模型注解和非侵入式脚本的结合使用) @HtmlHrlper方式创建的标签,会自动生成一些属性,其中一些属性就是关于验证如图示例: 模型注解通过模型注解后,MVC的验证,包括前台客 ...
使用phpAnalysis打造PHP应用非侵入式性能分析器
使用phpAnalysis打造PHP应用非侵入式性能分析器,查找PHP性能瓶颈. 什么是phpAnalysis phpAnalysis是一款轻量级非侵入式PHP应用性能分析器,适用于开发.测试及生产环 ...
BlockCanary 一个轻量的，非侵入式的性能监控组件（阿里）
开发者博客: BlockCanary — 轻松找出Android App界面卡顿元凶开源代码:moduth/blockcanary BlockCanary对主线程操作进行了完全透明的监控,并能输出有 ...
Spring学习（1）：侵入式与非侵入式，轻量级与重量级
一. 引言在阅读spring相关资料,都会提到Spring是非侵入式编程模型,轻量级框架,那么就有必要了解下这些概念. 二. 侵入式与非侵入式非侵入式:使用一个新的技术不会或者基本不改变原有代码结 ...
Spring 侵入式和非侵入式
1.非侵入式的技术体现允许在应用系统中自由选择和组装Spring框架的各个功能模块,并且不强制要求应用系统的类必须从Spring框架的系统API的某个类来继承或者实现某个接口. 2.如何实现非侵入式 ...
Spring框架是一种非侵入式的轻量级框架
摘自<Spring框架技术> Spring框架是一种非侵入式的轻量级框架 1.非侵入式的技术体现允许在应用系统中自由选择和组装Spring框架的各个功能模块,并且不强制要求应用系统的类必 ...
支付宝开源非侵入式 Android 自动化测试工具 Soloπ
Soloπ(SoloPi)是支付宝开源的一个无线化.非侵入式的Android自动化测试工具,公测版拥有录制回放.性能测试.一机多控三项主要功能,能为测试开发人员节省宝贵时间. 本文是SoloPi团队关 ...
侵入式&非侵入式
侵入式设计引入了框架,对现有的类的结构有影响:即需要实现或继承某些特定类. 例如:Struts框架非侵入式设计引入了框架,对现有的类结构没有影响. 例如:Hibernate框架 / Spring ...
Java非侵入式API接口即文档工具apigcc
一个非侵入的api编译.收集.Rest文档生成工具.工具通过分析代码和注释,获取文档信息,生成RestDoc文档前言程序员一直以来都有一个烦恼,只想写代码,不想写文档.代码就表达了我的思想和灵魂. ...

随机推荐

antDesignVue表格
<template> <a-table :pagination="ipagination" @change=" ...
ESP-Example ble-ancs解析
苹果通知中心服务(ANCS)的目的是让蓝牙配件(通过蓝牙低能耗链接连接到iOS设备)以简单方便的方式访问iOS设备上产生的各种通知. Apple通知中心服务是主服务,其UUID为7905F431-B5 ...
VMware 15pro虚拟机网络设置
在关闭虚拟机的情况下:VM 15pro. 编辑->虚拟网络编辑器:
React使用portal提示 The types returned by 'render()' are incompatible between these types. Type 'ReactPortal' is not assignable to type 'ReactNode'. Type '{}' is not assignable to type 'ReactNode'.
原因:组件返回了个不是<></>的东西原先代码: export default class Index extends React.PureComponent { rende ...
bzoj 3532
很好的一道题,对理解最小割有很大帮助首先,不难发现本题与网络流24题中的某一道很类似,我们可以先跑一次dp求出每个节点的LIS,然后拆点,拆出的两点之间连流量为删除的代价的边,剩下的点之间按dp的转 ...
微信小程序：流程/步骤流/时间轴自定义组件
效果图: 1.首先在小程序components目录下新建一个名为step的文件夹,再建step组件名.结构如下. 直接上代码 step.wxml <view class="step&q ...
Vue获取DOM的几种方法
虽然Vue实现了MVVM模型,将数据和表现进行了分离,我们只需要更新数据就能使DOM同步更新,但是某些情况下,还是需要获取DOM元素进行操作(比如引入的某个库要求传入一个根dom元素作为根节点,或者写 ...
MySQL innodb存储引擎的数据存储结构
InnoDB存储引擎的数据存储结构 B+ 树为什么选择B+树? 因为B+树的叶子节点存储了所有的data,所以它的非叶子节点可以存储更多的key,使得树更矮:树的高度几乎就是I/O的次数,所以选择更 ...
方法（Java）
什么是方法? 基本介绍在其他语言中也叫函数 System.out.println();类名.对象.方法: Java方法是语句的集合,它们在一起执行一个功能方法是解决一类问题的步骤的有序集合方法包 ...
microbit问题记录
问题: 1.电子罗盘东南西北:不太好用 2. micropython代码:震动.声音显示不对 makecode代码:声音不好用已解决: 1.摇杆下和左不管用了(已解决:改软件包代码) 2.ma ...

非侵入式入侵 —— Web缓存污染与请求走私