转载自:juejin - 马睿不想说话

概要

本文主要针对在使用node作为服务端接口时,前端上传上传文件至node作为中转,再次上传至oss/cdn的场景。以及针对在这个过程中,需要对同一个文件进行不同形式之间转换的问题。

Blob、File、Buffer与stream

在解答上述问题之前,我们要先了解一下Blob、File、Buffer与stream这四者分别是什么。以及这四者的关系是什么样的。

Blob

Blob 对象表示一个不可变、原始数据的类文件对象。

这是MDN对Blob的说明。简而言之,所有的“数据”都可以用blob的格式进行存储,而且不一定是 JavaScript 原生格式的数据。包括但不仅限于文本、二进制、文档流等。而通过Blob的实例方法(Blob.prototype.arrayBuffer()Blob.prototype.stream()),我们还可以将blob转换为Buffer和ReadableStream。

File

File接口基于 Blob,继承了 blob 的功能并将其扩展以支持用户系统上的文件。接口提供有关文件的信息,并允许网页中的 JavaScript 访问其内容,且可以用在任意的 Blob 类型的 context 中。

需要注意的一点是,File并没有任何定义方法,而是只从Blob继承了slice方法。

Buffer

Buffer是数据以二进制形式临时存放在内存中的物理映射。在Nodejs中,Buffer类是用于直接处理二进制数据的全局类型。它可以以多种方式构建。

stream

Node.js 中有四种基本的流类型:

开发前的规划

在我们进行文件上传的过程中,经历了两个阶段:

  1. 获取前端上传的文件
  2. 处理文件后,调用内部服务上传至cdn

其实这样看来的话,这是很简单的两个阶段,我们只需要拿到前端的文件后传递给另外一个接口就可以了,可是在这个过程中,有几个我们不得忽视的问题:

  1. 我们的node服务中获取到的前端上传的文件到底是什么格式?
  2. 我们进行上传oss/cdn的接口,需要我们上传的文件格式又是什么样的?
  3. 文件名称如何保持不变/如何进行混淆?
  4. 如何完成文件格式的校验或过滤?

只有在考虑清楚了以上这些内容的处理之后,才应该来考虑我们接口本身的业务逻辑的完善与开发。

开发中的问题

由于一些内部原因,Node端的开发经历了从koa2到express的重构。所以针对两个框架的文件处理,我也都有幸(bushi)全都经历了一次。

node上传格式

由于上传至oss的第三方接口可以在前端调用,也可以在node中进行调用,所以在Postman中可以模仿上传过程,由此可以看到第三方接口真正需要我们传入的其实是一个ReadStream格式的文件。
所以我们的目标也很简单,那就是无论我们获取到什么格式的文件,都转换成为ReadStream格式即可。

koa2

不同于在koa中使用koa-bodyparser模块来完成post请求的处理;在koa2中,使用koa-body模块不仅可以完成对于post请求的处理,同时也能够处理文件类型的上传。

在这种情况下我们只需要通过ctx.request.files即可访问前端上传给我们的文件实例,同时我们可以看到我们获取到的是一个WriteStream格式的文件。通过size、name、type等属性,即可获取相应的属性,用于进行文件格式的校验与判断

当我直接使用fs.createReadStream方法将它转换为我们所需要的格式时,问题也随之而来:

由于上传后的文件经过了koa的处理,所以我们得到的WriteStream的path发生了一些变化,他变成了内存中的一个地址导致我们转化之后的文件名称也发生了变化,变成了一个内存中的地址串。

很显然,这是我们不想要看到的,因为这对于我们来说是不可控的。为了解决这个问题,我尝试了两种解决方式均有效,大家可以自行选择。

1. 使用koa-body的配置参数,进行地址转存。

app.use(body({
multipart: true,
formidable:{
// 上传存放的路劲
uploadDir: path.join(__dirname,'./temp'),
// 保持后缀名\
keepExtensions: true,
onError(err){
console.log(err)
}
}
}));

2. 使用fs将文件转存至本地,上传完成后再进行删除

import * as fs from 'fs';

const file = ctx.request.files.file;
// 通过originalname获取文件原名称
const newName = file.originalname;
fs.writeFileSync(newName, file.path);
const newFile = fs.createReadStream(newName);
// 使用newFile进行文件上传。。。
fs.rmSync(newName);

在处理文件名称的过程中也可以手动的使用uuid来进行名称的混淆。有人可能认为,为什么宁愿那么麻烦的获取原来的名称、再使用uuid重新生成新名称,也不愿意直接使用内存地址作为文件名称呢?

很显然,因为这个流程对于我们来说是可控的

NestJSexpress

由于一些公司内部的历史原因,导致在使用koa2的开发过程中,缺少了一些swagger相关的功能实现。不得不使用NestJS+express来重构整个项目

而在NestJS中的上传,则需要使用NestJS提供的拦截器UseInterceptors,同时也需要依赖FileInterceptorUploadedFile来对于单文件上传的处理。FileInterceptor是拦截器负责处理请求接口后的文件 再使用UploadedFile进行文件接收。

import {  UploadedFile, UseInterceptors, Body, Post, Query } from '@nestjs/common';
import { FileInterceptor } from '@nestjs/platform-express'; @Post('/upload')
// "file" 表示 上传文件的键名
@UseInterceptors(FileInterceptor('file'))
public async uploadFileUsingPOST(
@Query() query: any,
@Body() body: any,
@UploadedFile() file,
) {
// body为form/data中的其他非文件参数
// query为请求中的Query参数
console.log(file, body, query);
return "上传成功";
}

由于思维惯性的影响,对于文件的处理产生了先入为主的思想,下意识的认为接口中获取到的前端上传文件格式仍然为WriteStream,结果在处理过程中发现文件格式变成了Buffer形式的二进制。因此在这个过程中我们就有需要再次处理从BufferReadStream的转换。

而在这个过程中,我顺便做了文件名称的混淆,而我采取的方式也是一个较笨的方式,直接上代码:

import { v4 } from 'uuid';
import * as fs from 'fs'; // 使用uuid作为文件名称,并且保留文件后缀
const newName: string = `${v4()}.${file.originalname.split('.')[1]}`;
// 将文件写入本地
fs.writeFileSync(newName, file.buffer);
// 使用本地文件生成ReadStream
const newFile = fs.createReadStream(newName);
// 生成请求使用的FormData
const formData = new FormData();
formData.append('files[]', newFile); /**
POST formData,完成文件上传
*/
fs.rmSync(newName); // 上传完成后,移除本地文件

文件格式校验

在解决了文件上传逻辑以及格式转换的问题后,我们再回过头来看一下是不是所有文件类型都允许上传至我们的oss或cdn上呢?这过程中会不会混入一些我们“不喜欢”的文件。

这里简单以NestJS的逻辑为例,简单列举一下代码。

import {  UploadedFile, UseInterceptors, Body, Post, Query } from '@nestjs/common';
import { FileInterceptor } from '@nestjs/platform-express'; @Post('/upload')
@UseInterceptors(FileInterceptor('file'))
public async uploadFileUsingPOST(
@Query() query: any,
@Body() body: any,
@UploadedFile() file,
) {
// 定义我们允许上传的文件类型白名单
const filterType: string[] = ['image', 'video'];
const { mimetype } = file;
// 判断当前上传至接口的文件类型是否在白名单中,如果在则允许上传,不在则返回错误信息
if (filterType.findIndex((f: string) => mimetype.includes(f)) < 0) {
return {
result: -1,
errMessage: "文件格式错误,仅支持上传图片、动图或视频",
success: false
};
}
return {
result: 1,
message: "上传成功",
success: true
};
}

总结

其实单纯就逻辑来讲,这是一件很简单的事情。无非就是我们获取文件流后用node服务作为“中转站”添加逻辑后再上传至“终点”。只不过重点还是在于我上面列举过的四个问题上:

  1. 我们的node服务中获取到的前端上传的文件到底是什么格式?
  2. 我们进行上传oss/cdn的接口,需要我们上传的文件格式又是什么样的?
  3. 文件名称如何保持不变/如何进行混淆?
  4. 如何完成文件格式的校验或过滤?

而解决这四个问题的重点,其实也很简单:

  1. 弄清楚我们获取到的类型与我们最终需要的类型到底是什么;
  2. 学习好不同文件类型之间的关系转换方式
  3. 想明白我们最终要上传的文件以一个什么样的名字来进行上传;
  4. 做好文件类型的白名单控制
  5. 杜绝惯性思维,了解清楚不同框架/技术栈之间到底有什么不同,再着手逻辑的开发。

参考文献

Blob - Web API 接口参考 | MDN

File - Web API 接口参考 | MDN

Stream | Node.js v15.14.0 Documentation

Buffer | Node.js v15.14.0 Documentaion

NestJS - 拦截器

NestJS - 文件上传

《上传那些事儿之Nest与Koa》——文件格式怎么了!的更多相关文章

  1. 【转载】文件上传那些事儿,文件ajax无刷上传

    导语 正好新人导师让我看看能否把产品目前使用的FileUploader从老的组件库分离出来的,自己也查阅了相关的各种资料,对文件上传的这些事有了更进一步的了解.把这些知识点总结一下,供自己日后回顾,也 ...

  2. 基于AngularJs的上传控件-angular-file-upload

    今天跟大家分享的是一个依赖于angular的上传控件. 前段时间做项目遇到一个需求是上传文件,大概需要实现的样式是这样子的,见下图: 需要同时上传两个文件.并且规定文件格式和文件大小.因为前端框架使用 ...

  3. [转]html5表单上传控件Files API

    表单上传控件:<input type="file" />(IE9及以下不支持下面这些功能,其它浏览器最新版本均已支持.) 1.允许上传文件数量 允许选择多个文件:< ...

  4. 利用ServletFileUpload组件上传文件

    自己的运用: public void UploadNoteFile(HttpServletRequest request,HttpServletResponse response){  String ...

  5. 在MVC中利用uploadify插件实现上传文件的功能

    趁着近段的空闲时间,开发任务不是很重,就一直想把以前在仓促时间里所写的多文件上传功能改一下,在网上找了很多例子,觉得uploadify还可以,就想用它来试试.实现自己想要的功能.根据官网的开发文档,同 ...

  6. 关于PHP上传文件时配置 php.ini 中的 upload_tmp_dir

    在<PHP 5.3 入门经典>9.6.3 的试一试中(P235),给出了一个上传文件的例子,这里的文件格式为jpeg图片(image/jpeg).如果之前未配置 php.ini 中的 up ...

  7. js 文件异步上传 显示进度条 显示上传速度 预览文件

    通常文件异步提交有几个关键 1.支持拖拽放入文件.2.限制文件格式.3.预览图片文件.4.上传进度,速度等,上传途中取消上传.5.数据与文件同时上传 现在开始笔记: 需要一个最基础的元素<inp ...

  8. SSM实现图片上传管理操作

    Spring MVC 实现文件上传 时序图 利用 Spring MVC 实现文件上传功能,离不开对 MultipartResolver 的设置.MultipartResolver 这个类,你可以将其视 ...

  9. Ant Design Upload 组件上传文件到云服务器 - 七牛云、腾讯云和阿里云的分别实现

    在前端项目中经常遇到上传文件的需求,ant design 作为 react 的前端框架,提供的 upload 组件为上传文件提供了很大的方便,官方提供的各种形式的上传基本上可以覆盖大多数的场景,但是对 ...

随机推荐

  1. 走进Redis:哨兵集群

    为什么需要哨兵 在 Redis 的主从库模式中,如果从库发生了故障,用户的操作是可以继续进行的,因为写操作是只在主库中进行的.那么,如果主库发生了故障,用户的操作将会收到影响.这时候可能会需要选择一个 ...

  2. 元数据治理利器 - Apache Atlas

    一.功能简介 Atlas 是一组可扩展的核心基础治理服务,使企业能够高效地满足其在 Hadoop 中的合规性要求,并允许与整个企业数据生态系统集成.Apache Atlas 为组织提供开放的元数据管理 ...

  3. java-流的使用完结与异常处理机制

    1.1java.io.objectInputStream 对象输入流:用于将一组字节(通过对象输出流写出对象而转换的一组字节)读取并转换为对应的对象.对象输出流将对象写出时转换为一组字节的过程,称为: ...

  4. 【java】学习路径25-ArrayList类,Vector类,LinkedList类的使用和区别,Iterator迭代器的使用

    ArrayList的使用 ArrayList类:可变化长度的数组. 与一般的数组不同的是,其长度不固定,可以添加任意类型的数据. 也可以添加不同类型的数据,但是一般不这么做. ArrayList类位于 ...

  5. 【漏洞分析】KaoyaSwap 安全事件分析

    相关信息 KaoyaSwap 是 BSC 链上的一个自动做市商 AMM.然后,现在他们的官网 https://www.kaoyaswap.com/ 已经打不开了(如果我打开方式没错的话).所以就直接进 ...

  6. SUSE Linux Enterprise Server 12 使用二进制文件安装docker

    Docker-CE in SUSE 虽然使用zypper添加源也能安装,不过我在SLES 12sp5 上安装时发现好多命令还需要自己手动软连接,干脆网上找了找文档,再自己小改下,用二进制部署,也是可以 ...

  7. 自定义View4-塔防小游戏第一篇:一个防御塔+多个野怪(简易版)*

    塔防小游戏 第一篇:一个防御塔+多个野怪(简易版)    1.canvas画防御塔,妖怪大道,妖怪行走路线    2.防御塔攻击范围是按照妖怪与防御塔中心距离计算的,大于防御塔半径则不攻击,小于则攻击 ...

  8. 手撸Router,还要啥Router框架?react-router/vue-router躺一边去

    有没有发现,在大家使用React/Vue的时候,总离不开一个小尾巴,到哪都得带着他,那就是react-router/vue-router,而基于它们的第三方框架又出现很多个性化约定和扩展,比如nuxt ...

  9. [C/C++]C语言-踩坑记录

    很久没写C语言的代码,发现很多小细节,记下来备查. 0. C语言常规头文件 #include <stdlib.h> #include <stdio.h> 1. 二维数组的开辟和 ...

  10. 《Java基础——方法的调用》

    Java基础--方法的调用     总结: 1. 在同一个类中-- 对于静态方法,其它的静态和非静态方法都可以直接通过"方法名"或者"类名.方法名"调用它. 对 ...