Flask下如何处理Requests 上传中文文件名的问题
一、问题的由来
最近有个项目,叫做文档服务资源中心,类似于七牛,为各个业务系统提供统一的文件资源服务,包括文件的存储、操作管理、下载、预览等。在做文件存储的时候,遇到了这个当指定上传的文件名为中文时,Flask框架的服务端无法解析成文件,而是当成一般的表单数据处理。我们在文件存储的实现架构如下图:

客户端业务系统(Python开发的)通过调用python-sdk中的上文文件API上传文件。按照requests这个类库上传文件的格式要求,必须指明文件的文件名。所以,在API开发完成之后,当上传的文件的文件名是中文的时候,测试没通过。
二、代码解析
客户端测试代码:

请注意,在files变量中,file对应的元组值的第一个参数“十三五”发展规划.docx”就是文件名,是中文格式。
服务端代码(简化后):

注意,在try..exception中的代码,判断是否获取文件成功。
运行:
先运行服务端代码,然后运行测试代码。结果如下:

进入调试模式,查看request变量的值,重点关注files跟form属性。如下图:

从上图可以,files的属性为空,而把file当成了form数据的属性,属性的值为文件的二进制内容数据。
三、问题缘由的查找
(1.)下载fiddler抓包工具。发现requests向flask网站服务传递如下数据。

特别注意,红框中的filename*这一段。
(2.)读Flask的源代码,特别注意Flask对上传文件的解析与处理。发现位于werkzeug下的formparser.py里的parse_lines方法中判断语句(位于文件的413行)

可以得出结论,Flask是根据名称为filename的键来判断Requests传递过来的数据是否是文件内容。而在上面通过fiddler抓包工具可知,Requests传递了filename*这个键的名称,多了一个*号。所以,Flask认为不是传递的文件,从而当成了一般属性处理。
(3.)那Requests为什么会传递filename*这样的键呢。再次跟踪并阅读Requests的源代码。返现Requests会对filename做编码的特殊处理。代码位于requestsàpackagesàurllib3—>fields.py(第22行的format_header_param方法)。

对不是ascii编码的内容,进行了rfc 2231编码,并组织成key*= rfc 2231这种格式。所以就有了上述的filename*这种格式的键值对。
四、解决办法
有三种解决办法。
(1.)修改Requests的源代码
requestsàpackagesàurllib3—>fields.py—>format_header_param方法的以下代码

改成

(2.)修改Flask的源代码
werkzeug下的formparser.py里的parse_lines方法中的413行开始的以下代码

改成

并导入相应的包。
(3.)修改调用Request的post方法时files变量的filename赋值,将其改成英文,比如设置成固定的file_name,而将真正的filename(最好带有后缀)当成data参数中的键名为file_name(根据项目情况,自由定义)的值传递给服务端,服务端去读取file_name对应的值就行。实现代码如下:

总结:修改Flask、requests类库的源代码不太理想,不便于部署,而且可能会发生其他意想不到的问题。建议采用第3中折中解决办法。
Flask下如何处理Requests 上传中文文件名的问题的更多相关文章
- 完美解决ExtJs6上传中文文件名乱码,后端SpringMVC
ExtJs上传中文文件名乱码,观察请求. ExtJs6上传乱码从后台无法解决,因为文件名请求里面就已经乱码了,后台无法解码. 除非请求参数正确没有乱码,后台因为编码设置不一样,可以通过后台处理乱码 这 ...
- PHP 中move_uploaded_file 上传中文文件名失败
项目需要上传文件名保持不变,发现上传中文失败:错误如下: move_uploaded_file(public/upload/files//-/\开密二次开发.rar): failed to open ...
- requests 上件中文文件名报错解决方案
这几天在用wxpy写机器人,在调用里面的上传文件接口的时候,一直报错.经过排查后,发现是不支持中文文件名:在群里问了下作者后才知道是requests惹的祸,默认requests用的是unicode来处 ...
- php 解决上传中文文件名时出现乱码的问题
有时候上传文件是中文的文件名会出现乱码, 可以在移动文件时使用icov('utf-8','gb2312',filename)转换 代码: <?php //header('Content-type ...
- Servlet 起航 文件上传 中文文件名下载
@WebServlet(name = "ticketServlet",urlPatterns = {"/tickets"},loadOnStartup = 1) ...
- Java中FTPClient上传中文目录、中文文件名乱码问题解决方法【好用】
转: Java中FTPClient上传中文目录.中文文件名乱码问题解决方法 问题描述: 使用org.apache.commons.net.ftp.FTPClient创建中文目录.上传中文文件名时,目录 ...
- php上传中文文件文件名乱码问题
php上传文件是最最基础的一个技术点,但是深入进去也有不少问题需要解决,这不,上传中文文件后,文件名变成了乱码. 下面是问题代码,很简单: 1.问题代码 html部分: <html> &l ...
- ueditor 1.4.3 gbk asp 上传中文乱码 终极解决方法 ie6 ie8 也适用
[摘要:百度编纂器1.43 gbk asp 题目 1.firefox3.0下 单图上传 面没有了 面多图上传 中央的蓝色按钮(即 面击挑选图片)没有表现(附件上传出那个题目) 没有晓得我的水狐吃翔了 ...
- requests上传文件
""" requests上传文件时,如果文件名是中文,会导致上传失败,参考:https://www.cnblogs.com/liaofeifight/p/5807901. ...
随机推荐
- 《PHP中的Math函数》笔记
① abs() 绝对值; ② ceil() 向上取整; ③ floor() 向下取整; ④ fmod() 返回除法的浮点数余数; ⑤ getrandmax() 显示随机数最大的可能值; ⑥ is_fi ...
- Unity 好坑的Save Scene
在编辑一个Untiy工程的时候,有很多的教程提到了 "Save Scene",也知道是干么用的.但是,后面打开工程的时候,工程界面是很多东西都不见了,又忘了有个Save Scene ...
- 纯CSS弹出菜单(不支持IE6.0以下)
<!DOCTYPE html> <html lang="en" xmlns="http://www.w3.org/1999/xhtml"> ...
- 关于datepicker只显示年、月、日的设置
关键时侯,还得看官方文档.花了半个多小时,找了网上一大堆答复,然后一一验证,90%没有能解决问题. 先给出官方文档的URL: http://bootstrap-datepicker.readthedo ...
- NPA——.NET Persistence API
你可曾听说过JPA. 有JPA那么就一定有NPA. 软件架构的路上一定少不了这个名词. —————————————————————————————————————————————— P Persist ...
- OpenGL glMultMatrixf() glPushMatrix() glPushMatrix()浅析
我在之前的博客中曾提到过,OpenGL中坐标是采用行向量表示的,与之相对应的是,在矩阵变换中使用的是变换矩阵的转置,并且使用的是后乘的方式.本文直接使用下面的代码来及其后的图示来解释函数 p,li { ...
- 如何正确的做WEB端的压力测试
1.对要测试的系统进行分析,明确需要对哪一块做压力测试.比如:淘宝网站双十一期间,秒杀跟支付,此模式用户操作中占比比较大 再比如:游戏,登录--开始战斗--结束战斗这种混合模式在用户操作中占比较大 那 ...
- 编译器--__attribute__ ((packed))
1. __attribute__ ((packed)) 的作用就是告诉编译器取消结构在编译过程中的优化对齐,按照实际占用字节数进行对齐,是GCC特有的语法.这个功能是跟操作系统没关系,跟编译器有关,g ...
- 51node1264(判断线段相交)
题目链接:https://www.51nod.com/onlineJudge/questionCode.html#!problemId=1264 题意:中文题诶- 思路:对于直线a1a2, b1b2, ...
- Redis
1. sds类型 sds为一种抽象数据结构 typedef char *sds;struct sdshdr { // buf 已占用长度int len; // buf 剩余可用长度int free; ...