数据格式转换(一)PDF转换技术
PDF(Portable Document Format)文件格式是Adobe公司开发的电子文件格式。
这样的文件格式与操作系统平台无关。这一特点使它成为在Internet上进行电子文档发行和数字化信息传播的理想文档格式。越来越多的电子图书、产品说明、公司文告、网络资料、电子邮件開始使用PDF格式文件。PDF格式文件眼下已成为数字化信息其实的一个工业标准。
PDF具有更多电子文档格式无法相比的长处。PDF文件格式能够将文字、字型、格式、颜色及独立于设备和分辨率的图形图像等封装在一个文件里。
该格式文件还能够包含超文本链接、声音和动态影像等电子信息,支持特长文件,集成度和安全可靠性都较高。PDF格式文件越来越为人们广泛使用。
红樱枫软件公司能够提供下面数据格式到PDF格式文件的转换服务。
- Microsoft Word文件→PDF文件的转换
(1)Microsoft Word文件的语言和版本号
★简体中文版Microsoft Word 97/2013/XP
★中文繁体版Microsoft Word 97/2013/XP
★英文版Microsoft Word 97/2013/XP
(2)生成PDF文件的基本功能
将用户提供的Word文件依据PDF1.3的标准。生成PDF文件。
生成PDF文件时。依据用户的需求,设定转换条件选项
★字体嵌入的设定
依据用户要求,将源Word文件里使用字体的轮廓数据嵌入到PDF文件里。该选项仅仅限定于TrueType和Type1种类的字体嵌入。当字体不能嵌入时,用空白文字进行替代。
★打开PDF文件口令的设定
依据用户要求,能够设定打开PDF文件的口令。设定的口令最长为32个字节文字。
0x20 ~ 0x7E, 0xA1 ~ 0xDF范围以外的文字及汉字不能作为口令使用。本应用程序软件使用40-bit RC4对PDF文件进行加密。
★安全性口令的设定
依据用户要求。能够设定安全性的口令。设定的口令最长为32个字节文字。0x20 ~ 0x7E, 0xA1 ~ 0xDF范围以外的文字及汉字不能作为口令使用。
★打印不同意的设
PDF文件的内容不同意打印。
★更改文档不同意的设定
PDF文件的内容不同意更改。
★选择文本和图形不同意的设定
PDF文件的内容不同意拷贝。
★加入或更改批注及表单域不同意的设定
PDF文件的批注及表单域不同意加入或更改。
★图像类型
依据用户要求,能够指定存放在PDF文件里图像的压缩方法。有[自己主动],[BMP]和[JPEG]三种图像类型。当指定[自己主动]时,选择图像压缩后SIZE较小的压缩方法。JPEG或ZLIB。
★图像质量
依据用户要求,能够指定图像质量。指定的范围为1~100。数字越大图像质量越好。
但作成的PDF文件的比較大。
- 各种图像图形文件→PDF文件的转换
(1)图像文件的种类
★BMP,GIF,TIFF,WMF,EMF,JPG,JPEG
(2)图形文件的种类
★CGM,SVG
- 文本文件→PDF文件的转换
(1)源文本文件的语言
简体中文,日文。英文
(2)源文本文件使用的文字集合
★简体中文:GB2312、GBK
★日文:Jis、Shift_Jis、EUC_JP、EUC_JP_Fix、ISO2022_JP、Window31J
★英文:ISO8859-1
★Unicode(UTF8、UTF16、UCS4、UCS8)
(3)生成PDF文件的基本功能
★语言的设定
简体中文,日文。英文
★字体的设定
依据系统设定的字体
★字体修饰的设定
下划线,取消线。粗体,斜体
★字体字号的设定
8,9。10,……72
★字体颜色的设定
48种基本颜色和16种自己定义颜色
★页面设置
纸型:A4,A3,B4,B5或自己定义纸的长和宽
方向:纵向和横向
余白:
- XML+XSL文件→PDF文件的转换
我公司依据W3C策划并推广的Extensible Stylesheet Language(XSL)式样开发了XML排版,显示,打印及转换为PDF文件的XSLFormatter软件产品。利用自主开发的PDFCreator程序库。在系统不须要安装Acrobat情况下,将XML+XSL排版结果输出为PDF文件。
(1)XSLFormatterV3.0产品的功能概要
★本产品具有强大的排版功能。能将带有页眉,页脚的XML文件以页为单位进行排版。自己主动生成文件夹和索引。
★能够实现文本长度伸缩的样式。
★利用自主开发的PDFCreator程序库,在系统不须要安装Acrobat情况下,将排版结果输出为PDF文件。
★能够实现快速,大容量的排版。
★利用自主开发的SVG绘画软件,在PDF中绘画高分辨率的画像。
★支持多国语言
(2)PDF Creator程序库的技术特点
★支持文字,图像。图形以及其它一些复杂功能,如函数。阴影等;支持图像包含BMP和JPEG等格式;支持图形的Bezier曲线;利用函数。阴影等功能对图形和图像进行美化处理,制造出非常强的立体感。
★支持多种语言,包含中、日、韩、西文等,并能处理特殊的泰文,阿拉伯文等。
★支持PDF的压缩功能,能够将bmp图像压缩成Jpeg格式保存到Pdf文件里,还能够将文字以Flate方式进行压缩,从而大大缩小了文件的Size。
★支持PDF的加密功能。
★支持PDF的书签、凝视(包含链接凝视、文本凝视、取消线凝视、下划线凝视等多种凝视)功能。
★支持字体嵌入功能。
★支持图形剪切功能。
数据格式转换(一)PDF转换技术的更多相关文章
- 金软PDF转换(x-PDFConper)
一.产品概述 金软PDF转换(x-PDFConper)软件产品是一款能够在手机.平板电脑等移动终端设备上.能够浏览MS Office 的Word.Excel.PowerPoint.PDF 等四种格式文 ...
- 如何用ABBYY把PDF转换成PPT
在电子科技迅速发展的今天,文件格式转换并不是什么稀罕事,因为现在都是电子化办公,出现很多文件格式,但是不同的场合需要的格式不同,所以常常需要进行文件格式的转换.PDF转换成PPT也是众多文件格式转换中 ...
- C#技术分享【PDF转换成图片——13种方案】(2013-07-25重新整理)
原文:C#技术分享[PDF转换成图片--13种方案](2013-07-25重新整理) 重要说明:本博已迁移到 石佳劼的博客,有疑问请到 文章新地址 留言!!! 写在最前面:为了节约大家时间,撸主把最常 ...
- C#技术分享【PDF转换成图片——11种方案】
1.[iTextSharp.dll],C# 开源PDF处理工具,可以任意操作PDF,并可以提取PDF中的文字和图片,但不能直接将PDF转换成图片. DLL和源码 下载地址:http://downloa ...
- 网络采集软件核心技术剖析系列(4)---使用C#语言如何将html网页转换成pdf(html2pdf)
一 本系列随笔概览及产生的背景 本系列开篇受到大家的热烈欢迎,这对博主是莫大的鼓励,此为本系列第四篇,希望大家继续支持,为我继续写作提供动力. 自己开发的豆约翰博客备份专家软件工具问世3年多以来,深受 ...
- C#将Word转换成PDF方法总结(基于Office和WPS两种方案)
有时候,我们需要在线上预览word文档,当然我们可以用NPOI抽出Word中的文字和表格,然后显示到网页上面,但是这样会丢失掉Word中原有的格式和图片.一个比较好的办法就是将word转换成pdf,然 ...
- ASP.Net中实现上传过程中将文本文件转换成PDF的方法
iTextSharp是一个常用的PDF库,我们可以使用它来创建.修改PDF文件或对PDF文件进行一些其他额外的操作.本文讲述了如何在上传过程中将文本文件转换成PDF的方法. 基本工作 在开始之前,我们 ...
- C# 将PowerPoint文件转换成PDF文件
PowerPoint的优势在于对演示文档的操作上,而用PPT查看资料,反而会很麻烦.这时候,把PPT转换成PDF格式保存,再浏览,不失为一个好办法.在日常编程中和开发软件时,我们也有这样的需要.本文旨 ...
- Latex转换之PDF
近期一直在做如何使用latex将模板转换成PDF.现在写下在项目中如何实现. 1.首先你先进官网下载http://www.miktex.org/download.我用的是如下图所示. 在下载好的Mik ...
- Python 将pdf转换成txt(不处理图片)
上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要.查找了很多资料,在linux下要将d ...
随机推荐
- linux自动更新代码,自动备份数据库,打包应用发布
切换root用户 sudo su - 1.安装svn,mysql yum install subversion yum install mysql 2.安装 maven 下载:百度云盘地址为 http ...
- unity3d优化总结篇(二)
1. 尽量避免每帧处理,可以每隔几帧处理一次 比如: [C#] 纯文本查看 复制代码 function Update() { DoSomeThing(); } 可改为每5帧处理一次: [C#] ...
- css 实现省略号. text-overflow: ellipsis; 同时设置四个属性才可以.
这个同时需要. text-overflow ; overflow ; white-space ; width ; 四个属性才可以. <!DOCTYPE html> <htm ...
- python自学第三天,列表
1.列表 names=[] #这就是一个空列表 names=[1,5,2,3,4,5]#列表是用的中括号,每个元素是用逗号分开的.列表里面的元素是可以重复的. names[-1]#表示的是取列表的最后 ...
- Microsoft Project 常用快捷键
任务升级 : ALT + SHIFT + 向左键 任务降级: ALT + SHIFT + 向右键 滚动到表头(第一个任务):Ctrl + HOME 滚动到表尾(最后一个任务):Ctrl + E ...
- Bug03_SSM整合_mybatis result maps collection already contains value...
这个问题是在映射文件,但是这个映射文件是自动生成的. 所以想起来可能是在自动生成映射文件,pojo类时操作有问题.第一次运行时,出现错误,没有删除已经生成的文件就直接运行了第二次. 解决办法:删除旧的 ...
- XML Schema——笔记整理
什么是 XML Schema? 定义可出现在文档中的元素 定义可出现在文档中的属性 定义哪个元素是子元素 定义子元素的次序 定义子元素的数目 定义元素是否为空,或者是否可包含文本 定义元素和属性的数据 ...
- DG备库缺失归档文件GAP日志
问题现象: XXXsdgebus-dg GAP手工注册归档 #出现GAP idle>select * from v$archive_gap; THREAD# LOW_SEQUENCE# HIGH ...
- 带列表写入文件出错先 json.dumps
output = json.dumps(output, ensure_ascii=False).encode('utf-8')
- BZOJ4426 :最大生产率(贪心+决策单调性DP)
题意:给出N个人,现在让你分P组,每组的工作效率是最小结束时间-最大开始时间,要求每一组的效率的正数,求最大效率和.N<1000 思路: 把包含至少一个其他的分到A组:否则到B组. A组的要么单 ...