所用到的七牛文档转换服务,主要是:ppt文件转为pdf文件,pdf文件转图片(png)。

描述一下需求:上传PPT或者PDF文件到七牛,最终转换为图片。文件上传部分的功能已经讲过了,这里说一下转换处理的部分。

文档类型

因为七牛整个的文件存储系统中文件类型并不靠后缀来区分,而是有它自己的 文件类型(mineType),所以在堆bucket中的资源进行处理的时候,首先要判断minetype。

多次的测试结果表明,pdf文件上传后的minetype一为application/pdf,而ppt上传后的类型就比较多了,通过jssdk上传,以及直接在七牛上传,上传后缀为ppt、pptx的结果都有可能不一样。最终总结出如下的几种类型:

  1. application/vnd.openxmlformats-officedocument.presentationml.presentation
  2. application/zip
  3. application/vnd.ms-powerpoint
  4. application/ppt
  5. application/x-ole-storage

这里的文档类型判断PHP-SDK已经提供了,是BucketManager这个类。

//使用方式
$bucketManager = new BucketManager($this->getAuth());//getAuth()方法见七牛php-sdk使用-文件上传
$mineTypeInfo = $bucketManager->stat(bucketName, 七牛资源名);
$mimeType = $mineTypeInfo[0]['mimeType'];
持久化处理

七牛的服务都是通过http请求附加不同的参数来实现的,比如我们处理剪裁一张图片,或者获取视频某一秒的截图,在我们的页面中可以直接使用src=http://qiniu.com.cn?xxx这种方式,就能得到我们想要结果,但有的时候我们需要把处理的结果保存到我们的bucket中,这个就是持久化处理了。

根据sdk封装一个持久化处理的方法,用到的sdk类为PersistentFop

/**
* 文件持久化处理
* @param $key 七牛资源名
* @param $pfop 对资源进行的数据处理操作的命令
* @param $bucket bucketName
* @return persistentId
*/
public function persistentOps($key,$bucket,$pfop,$notifyUrl='',$check=true)
{
header('Access-Control-Allow-Origin:*'); $auth = $this->getAuth();
$persistOps = new PersistentFop($auth,$bucket,$this->qiniu_image_pipeline,$notifyUrl);
list($id,$error) = $persistOps->execute($key,$pfop);
if($check){
//可暂时忽略,用来检查资源持久化处理状态
$result = $this->checkStatus($id,$persistOps);
}else{
$result = true;
}
return $result;
}
PPT转PDF

使用到的持久化出来命令为:$pfop[] = 'yifangyun_preview/v2|saveas/'.$key;,这里使用的是七牛的第三方文档转换服务,因为七牛之前的odconv/pdf已经不再更新维护了,而且出现过转为pdf排版出现遮挡以及乱码等问题,所以改为使用亿方云的服务。

这里面saveas,即保存为一个新的资源,$key需要做一下说明,按照七牛的要求必须是:

$key = \Qiniu\base64_urlSafeEncode(bucketName.':'.$sourceName);

如果不按照规则进行encode,无法保存成功。base64_urlSafeEncode,sdk functions.php中已经存在。

有了原始的key,saveas的key,以及pfop持久化处理命令,就可以调用persistentOps方法了:

$result = $this->persistentOps($sourceName,$bucketName,$pfop);

pfop可以是一个数组,包含多个处理命令。

PDF转图片PNG

因为没有PPT转图片这条路,所以只能先转PDF。

用到的pfop命令:

odconv/png/page/页码/density/150/quality/80|saveas/'.$key;

参数包括页码,质量,像素密度等,还有更多的参数可以查阅文档。所以这里我们首先要获取PDF文档的总页数。使用到的接口命令是:

//odconv/png/info
$url = 'http://'.$this->qiniu_image_domain.'/'.$sourceName.'.pdf?odconv/png/info';
//url部分就是七牛资源可以访问的完整链接,?后面就是要用到的命令

使用curl去请求这个链接,会返回json数据,里面会包含page_num成员。

有了page_num,就可以构造pfop数组了。

public function pdf2PngPfop($page,$sourceName)
{
$pfop = [];
$pngName = $sourceName;//原图
for($i=1;$i<=$page;$i++){
$randName = $pngName.'_'.$i.'.png';//原图
$key = \Qiniu\base64_urlSafeEncode($this->bucket_for_image.':'.$randName);
$pfop[] = 'odconv/png/page/'.$i.'/density/150/quality/80|saveas/'.$key;
}
return $pfop;
}

然后调用:

$res = $this->persistentOps($sourceName.'.pdf',$this->bucket_for_image,$pfop,'',false);

note:在处理比较大的文档,例如一个PPT有100多页,那PHP运行等待七牛的结果返回再进行数据的保存就可能会超时,一个解决方案,是指定回调url,persistentOps的倒数第二个参数就是回调url,当文档转换完成的时候,七牛会向这个地址发起一个请求,后续的图片链接保存操作我们交给回调来做。

tips: 如果对每个pfop命令都指定回调地址,对我们的(普通)业务服务器也会造成些许的请求压力,所以我的做法是给最后一页的PDF转图片命令添加回调url。

回调地址函数
public function actionQiniuCallback()
{
$notifyBody = file_get_contents('php://input');
$notifyBodyArray = json_decode($notifyBody,true); $topicId = Yii::$app->request->get('topicId');
$totalPage = Yii::$app->request->get('totalPage');//pdf页数
$key = $notifyBodyArray['inputKey'];//这个是pdf文件的key
//业务代码
...
}
总结

php来做这个文档转换七牛七牛遇到的一个主要问题就是超时的问题,所以我们可以把转换的过程拆解,在数据库中保存处理状态,然后用定时任务来自动处理。

七牛php-sdk使用-文档处理的更多相关文章

  1. Async Cow Python 七牛异步SDK

    # Async Cow Python 七牛异步SDK > gitee链接 >github链接本SDK基于官方SDK改造而成,但又对其进行了进一步封装,简化了相关操作例如:- 1.不需要使用 ...

  2. 基于七牛Python SDK写的一个批量下载脚本

    前言 上一篇基于七牛Python SDK写的一个同步脚本所写的脚本只支持上传,不支持文件下载. 虽然这个需求不太强烈,但有可能有人(在备份.迁移时)需要,而官方有没提供对应的工具,所以我就把这个功能也 ...

  3. 基于七牛Python SDK写的一个同步脚本

    需求背景 最近刚搭了个markdown静态博客,想把博客的图片放到云存储中. 经过调研觉得七牛可以满足我个人的需求,就选它了. 博客要引用图片就要先将图片上传到云上. 虽然七牛网站后台可以上传文件,但 ...

  4. [转载]Android SDK 离线文档 (api 20)(升级至api 23)

    原文地址:SDK 离线文档 (api 20)(升级至api 23)">Android SDK 离线文档 (api 20)(升级至api 23)作者:leechenhwa Android ...

  5. 七牛php sdk 生成上传凭证时出现 undefined function Qiniu_SetKeys()

    将qiniu/http.php文件改名即可,原因是xampp等集成环境会安装pear存在了http.php

  6. 【Mongodb教程 第七课 】MongoDB 查询文档

    find() 方法 要从MongoDB 查询集合数据,需要使用MongoDB 的 find() 方法. 语法 基本的find()方法语法如下 >db.COLLECTION_NAME.find() ...

  7. 七牛Qshell 常用命令打印

    下载 该工具使用Go语言编写而成,当然为了方便不熟悉Go或者急于使用工具来解决问题的开发者,我们提供了预先编译好的各主流操作系统平台的二进制文件供大家下载使用,由于平台的多样性,我们把这些二进制打包放 ...

  8. iOS 客户端获取七牛上传token

    一.官方参考文档: 1.上传策略http://developer.qiniu.com/article/developer/security/put-policy.html 2.上传凭证(即uptoke ...

  9. 七牛用户搭建c# sdk的图文讲解

    Qiniu 七牛问题解答 问题描写叙述:非常多客户属于小白类型. 可是请不要随便喷七牛的文档站.由于须要一点http的专业知识才干了解七牛的api文档.如今我给大家弄个c# sdk的搭建步骤 问题解决 ...

  10. 受不了Android SDK文档打开缓慢问题,自己开发简易脱机浏览器。

    google android sdk离线文档打开的时候特别慢,据说是要从谷歌官网拉取一些东西导致的.脱机浏览能够解决该问题.PC端能够使用firefox. 可是Android端貌似没有支持脱机工作的浏 ...

随机推荐

  1. 如何解决更新被拒绝,因为远程版本库包含您本地尚不存在的提交。这通常是因为另外 提示:一个版本库已向该引用进行了推送。再次推送前,您可能需要先整合远程变更 提示:(如 'git pull ...')。

    不要通过网页提交,通过网页提交一次,然后在终端再次push的时候,会认为网上代码仓库已经被其他地方提交过一次代码,此时会拒绝终端push 这个时候只能是pull,然后才能再次在终端提交. 也就是说,避 ...

  2. angular过滤器基本用法

    1.过滤器主要用于数据的筛选,可以直接在模板使用 语法: {{expression | filter}} {{expression | filter | filter2}} {{expression ...

  3. java-生成任意格式的json数据

    最近研究java的东西.之前靠着自己的摸索,实现了把java对象转成json格式的数据的功能,返回给前端.当时使用的是 JSONObject.fromObject(object) 方法把java对象换 ...

  4. Linux主机SSH免密设置解析

    为了保证一台Linux主机的安全,所以我们每个主机登录的时候一般我们都设置账号密码登录.但是很多时候为了操作方便,我们都通过设置SSH免密码登录.那么该如何设置?是不是免密码登录就不安全了呢? 一.被 ...

  5. jquery如此强大,为什么还要写原生呢?

    这是一个伪标题,其实是一篇年终总结. 在这家公司一年多,蛮多收获的.大部分来自自己,小部分来自公司. 做前端开发到现在,我觉得可以分为两部分. 前半部分做项目用原生js,jquery以及各种基于jq的 ...

  6. Mac shell笔记

    用来自动执行一些前端发布的操作. 脚本: # webReleasePath用来发布的目录,webRevisionPath是开发的目录 webReleasePath='/Users/lufeng/Doc ...

  7. k-近邻算法实例

    1. 简单例子 步骤 1.1 计算已知点和被求点的距离 1.2 按距离递增排序 1.3 求出距离最近的前k个点的类别最大值作为目标分类 from numpy import * import opera ...

  8. kibana提示“Your Kibana index is out of date, reset it or use the X-Pack upgrade assistant.”

    =============================================== 2017/12/15_第1次修改                       ccb_warlock = ...

  9. Linux下创建root权限的账号osadmin

    创建root权限的账号osadmin 命令为: useradd -u 0 -o -g root -G root -d /home/osadmin osadmin 创建成功后验证效果: id osadm ...

  10. Macaca自动化工具之uirecorder脚本录制

    UI Recorder功能介绍 支持所有用户行为: 键盘事件, 鼠标事件, alert, 文件上传, 拖放, svg, shadow dom 支持无线native app录制, 基于macaca实现: ...