数据格式转换(一)PDF转换技术
PDF(Portable Document Format)文件格式是Adobe公司开发的电子文件格式。
这样的文件格式与操作系统平台无关。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件開始使用PDF格式文件。PDF格式文件眼下已成为数字化信息其实的一个工业标准。
PDF具有更多电子文档格式无法相比的长处。PDF文件格式能够将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件里。
该格式文件还能够包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。PDF格式文件越来越为人们广泛使用。
红樱枫软件公司能够提供下面数据格式到PDF格式文件的转换服务。
- Microsoft Word文件→PDF文件的转换
(1)Microsoft Word文件的语言和版本号
★简体中文版Microsoft Word 97/2013/XP
★中文繁体版Microsoft Word 97/2013/XP
★英文版Microsoft Word 97/2013/XP
(2)生成PDF文件的基本功能
将用户提供的Word文件依据PDF1.3的标准。生成PDF文件。
生成PDF文件时。依据用户的需求,设定转换条件选项
★字体嵌入的设定
依据用户要求,将源Word文件里使用字体的轮廓数据嵌入到PDF文件里。该选项仅仅限定于TrueType和Type1种类的字体嵌入。当字体不能嵌入时,用空白文字进行替代。
★打开PDF文件口令的设定
依据用户要求,能够设定打开PDF文件的口令。设定的口令最长为32个字节文字。
0x20 ~ 0x7E, 0xA1 ~ 0xDF范围以外的文字及汉字不能作为口令使用。本应用程序软件使用40-bit RC4对PDF文件进行加密。
★安全性口令的设定
依据用户要求。能够设定安全性的口令。设定的口令最长为32个字节文字。0x20 ~ 0x7E, 0xA1 ~ 0xDF范围以外的文字及汉字不能作为口令使用。
★打印不同意的设
PDF文件的内容不同意打印。
★更改文档不同意的设定
PDF文件的内容不同意更改。
★选择文本和图形不同意的设定
PDF文件的内容不同意拷贝。
★加入或更改批注及表单域不同意的设定
PDF文件的批注及表单域不同意加入或更改。
★图像类型
依据用户要求,能够指定存放在PDF文件里图像的压缩方法。有[自己主动],[BMP]和[JPEG]三种图像类型。当指定[自己主动]时,选择图像压缩后SIZE较小的压缩方法。JPEG或ZLIB。
★图像质量
依据用户要求,能够指定图像质量。指定的范围为1~100。数字越大图像质量越好。
但作成的PDF文件的比較大。
- 各种图像图形文件→PDF文件的转换
(1)图像文件的种类
★BMP,GIF,TIFF,WMF,EMF,JPG,JPEG
(2)图形文件的种类
★CGM,SVG
- 文本文件→PDF文件的转换
(1)源文本文件的语言
简体中文,日文。英文
(2)源文本文件使用的文字集合
★简体中文:GB2312、GBK
★日文:Jis、Shift_Jis、EUC_JP、EUC_JP_Fix、ISO2022_JP、Window31J
★英文:ISO8859-1
★Unicode(UTF8、UTF16、UCS4、UCS8)
(3)生成PDF文件的基本功能
★语言的设定
简体中文,日文。英文
★字体的设定
依据系统设定的字体
★字体修饰的设定
下划线,取消线。粗体,斜体
★字体字号的设定
8,9。10,……72
★字体颜色的设定
48种基本颜色和16种自己定义颜色
★页面设置
纸型:A4,A3,B4,B5或自己定义纸的长和宽
方向:纵向和横向
余白:
- XML+XSL文件→PDF文件的转换
我公司依据W3C策划并推广的Extensible Stylesheet Language(XSL)式样开发了XML排版,显示,打印及转换为PDF文件的XSLFormatter软件产品。利用自主开发的PDFCreator程序库。在系统不须要安装Acrobat情况下,将XML+XSL排版结果输出为PDF文件。
(1)XSLFormatterV3.0产品的功能概要
★本产品具有强大的排版功能。能将带有页眉,页脚的XML文件以页为单位进行排版。自己主动生成文件夹和索引。
★能够实现文本长度伸缩的样式。
★利用自主开发的PDFCreator程序库,在系统不须要安装Acrobat情况下,将排版结果输出为PDF文件。
★能够实现快速,大容量的排版。
★利用自主开发的SVG绘画软件,在PDF中绘画高分辨率的画像。
★支持多国语言
(2)PDF Creator程序库的技术特点
★支持文字,图像。图形以及其它一些复杂功能,如函数。阴影等;支持图像包含BMP和JPEG等格式;支持图形的Bezier曲线;利用函数。阴影等功能对图形和图像进行美化处理,制造出非常强的立体感。
★支持多种语言,包含中、日、韩、西文等,并能处理特殊的泰文,阿拉伯文等。
★支持PDF的压缩功能,能够将bmp图像压缩成Jpeg格式保存到Pdf文件里,还能够将文字以Flate方式进行压缩,从而大大缩小了文件的Size。
★支持PDF的加密功能。
★支持PDF的书签、凝视(包含链接凝视、文本凝视、取消线凝视、下划线凝视等多种凝视)功能。
★支持字体嵌入功能。
★支持图形剪切功能。
数据格式转换(一)PDF转换技术的更多相关文章
- 金软PDF转换(x-PDFConper)
一.产品概述 金软PDF转换(x-PDFConper)软件产品是一款能够在手机.平板电脑等移动终端设备上.能够浏览MS Office 的Word.Excel.PowerPoint.PDF 等四种格式文 ...
- 如何用ABBYY把PDF转换成PPT
在电子科技迅速发展的今天,文件格式转换并不是什么稀罕事,因为现在都是电子化办公,出现很多文件格式,但是不同的场合需要的格式不同,所以常常需要进行文件格式的转换.PDF转换成PPT也是众多文件格式转换中 ...
- C#技术分享【PDF转换成图片——13种方案】(2013-07-25重新整理)
原文:C#技术分享[PDF转换成图片--13种方案](2013-07-25重新整理) 重要说明:本博已迁移到 石佳劼的博客,有疑问请到 文章新地址 留言!!! 写在最前面:为了节约大家时间,撸主把最常 ...
- C#技术分享【PDF转换成图片——11种方案】
1.[iTextSharp.dll],C# 开源PDF处理工具,可以任意操作PDF,并可以提取PDF中的文字和图片,但不能直接将PDF转换成图片. DLL和源码 下载地址:http://downloa ...
- 网络采集软件核心技术剖析系列(4)---使用C#语言如何将html网页转换成pdf(html2pdf)
一 本系列随笔概览及产生的背景 本系列开篇受到大家的热烈欢迎,这对博主是莫大的鼓励,此为本系列第四篇,希望大家继续支持,为我继续写作提供动力. 自己开发的豆约翰博客备份专家软件工具问世3年多以来,深受 ...
- C#将Word转换成PDF方法总结(基于Office和WPS两种方案)
有时候,我们需要在线上预览word文档,当然我们可以用NPOI抽出Word中的文字和表格,然后显示到网页上面,但是这样会丢失掉Word中原有的格式和图片.一个比较好的办法就是将word转换成pdf,然 ...
- ASP.Net中实现上传过程中将文本文件转换成PDF的方法
iTextSharp是一个常用的PDF库,我们可以使用它来创建.修改PDF文件或对PDF文件进行一些其他额外的操作.本文讲述了如何在上传过程中将文本文件转换成PDF的方法. 基本工作 在开始之前,我们 ...
- C# 将PowerPoint文件转换成PDF文件
PowerPoint的优势在于对演示文档的操作上,而用PPT查看资料,反而会很麻烦.这时候,把PPT转换成PDF格式保存,再浏览,不失为一个好办法.在日常编程中和开发软件时,我们也有这样的需要.本文旨 ...
- Latex转换之PDF
近期一直在做如何使用latex将模板转换成PDF.现在写下在项目中如何实现. 1.首先你先进官网下载http://www.miktex.org/download.我用的是如下图所示. 在下载好的Mik ...
- Python 将pdf转换成txt(不处理图片)
上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要.查找了很多资料,在linux下要将d ...
随机推荐
- Cracking The Coding Interview 2.0 单链表
#include <iostream> #include <string> using namespace std; class linklist { private: cla ...
- 2.16 C++类与new和delete操作符
参考: http://www.weixueyuan.net/view/6347.html 总结: 当我们需要为类对象动态分配存储空间时,我们应该使用C++语言提供的new与new[]操作符,而不要使用 ...
- 栈回溯简单实现(x86)
0x01 栈简介 首先局部变量的分配释放是通过调整栈指针实现的,栈为函数调用和定义局部变量提供了一块简单易用的空间,定义在栈上的变量不必考虑内存申请和释放.只要调整栈指针就可以分配和释放内存. ...
- k8s weave network IP回收冲突
问题:将备用集群的一个机器加入到新的集群中的时候,出现该机器上的pod都不能被访问. 查明原因是weave 没有删除干净 https://github.com/weaveworks/weave/iss ...
- ylz外网连接ESB流程
先在指定目录下写Controller,在目录下com.ylzinfo.controller.zhizhi package com.ylzinfo.controller.zhizhi; import j ...
- L262
A London patient has become the second known man worldwide to be cleared of AIDS virus after receivi ...
- day 29 socket 理论
网络编程(socket,套接字) 服务端地址不变 ip + mac 标识唯一一台机器 ip +端口 标识唯一客户端应用程序 套接字: 网络编程 网络编程 一.python提供了两个级别访问的网 ...
- chromium ④
chromium的源码非常大,选择合适的点入手能省不少力气.在 win7下编译chromium中我曾提到学习chromium源码的一个小工程test_shell,代码目录在src/webkit/too ...
- java学习笔记25(Collections类)
Collections算法类: Collections是一个算法类,提供了一系列静态方法,实现对集合的排序.替换.交换.搜索.拷贝等操作: 用法:Collections.方法名(要操作的集合): 就像 ...
- Hibernate总结以及在面试中的一些问题.
Hibernate总结以及在面试中的一些问题. 1.为什么要使用Hibernate开发你的项目呢?Hibernate的开发流程是怎么样的? 为什么要使用 ①.对JDBC访问数据库的代码做了封装,大 ...