[ASP.net MVC] 将HTML转成PDF档案,使用iTextSharp套件的XMLWorkerHelper (附上解决显示中文问题)
原文:[ASP.net MVC] 将HTML转成PDF档案,使用iTextSharp套件的XMLWorkerHelper (附上解决显示中文问题)
[ASP.net MVC] 将HTML转成PDF档案,使用iTextSharp套件的XMLWorkerHelper (附上解决显示中文问题)
前言
最近专案又遇到需要制作PDF文件的需求,这次还要额外控制PDF档案的其他功能,我的直觉马上联想到使用iTextSharp来实现
一般使用iTextSharp套件要塞资料到PDF档案里的话,大概要先把Phrase、PdfPTable、PdfPCell……等等几个物件叫出来,然後加入至Document物件
※请参考其他网友文章:使用ASP .NET (C#) 产生PDF档的好帮手—iTextSharp library (上)、使用ASP .NET (C#) 产生PDF档的好帮手—iTextSharp library (下)
但由於专案要求有 [网页预览+下载PDF(把预览的网页画面转出到PDF档)功能]
因为已经先有Html网页画面了,我比较懒,所以在网路上寻求有没有把Html网页转PDF档的iTextSharp实现办法
虽然过程中有考量用:[ASP.net MVC] 在Web专案上使用Pechkin套件将网页转成PDF档
但Pechkin没办法进一步控制PDF档案的详细功能,它只能仅仅印出来而已
所以整个需求大致是:利用iTextSharp套件将网页档(或HTML文字)转成PDF档
?
而iTextSharp一般在网路上比较常见,都是使用内建的HtmlWorker物件来实现
※HtmlWorker已有中文字显示问题的解决办法,请参考其他网友文章:使用iTextSharp 5将html档转成PDF档
但本文使用的是XMLWorkerHelper物件来Parse网页Html文字
因为比起HtmlWorker物件,XMLWorkerHelper类别支援更多CSS和Html标签(例如<hr/>),但缺点预设不支援中文字
不过中文字显示问题,已经在下文的Sample Code中解决了
?
实作
先为Web专案透过NuGet加入以下参考
![]()
![]()
以下是要输出成PDF档案的范例静态网页内容,还没套程式,因为套程式塞资料到画面不是本文的重点
此网页Html该注意的重点都在说明注解里
<!--设定width为100%以刚好符合PDF文件的宽度-->
<!--如果width为固定宽度的话,C#那边可能要改写成Document doc = new Document(PageSize.A3)-->
<!--此table已调整好高度刚好符合PDF A4一页的高度了-->
<table style='width:100%;' >
<tr >
<td colspan='2' style='color:#808080;'>
<h2>[厂商名称]</h2>
</td>
</tr>
<tr style='font-size:13px;'>
<td style='width:600px;color:#808080;font-size:16px;'>Taiwan Limited<br />4F,144 Changchun Rd., Taipei 104, Taiwan</td>
<td style='width:80%;color:#808080;font-size:16px;text-align:right;'>[页码]/[总页数]</td>
</tr>
<tr>
<td colspan='2' style='text-align:center; height:90px;'><h1>XXX借用函证书</h1></td>
</tr>
<tr>
<td colspan='2' style='text-align:right;font-size:20px;'> 日期:民国[函证民国日期] </td>
</tr>
<tr>
<td colspan='2' style='height:10px;font-size:20px;' > 敬启者:[经销商全衔] </td>
</tr>
<tr>
<td colspan='2' style='height:30px;font-size:20px;' > XXX 借用人:[员工姓名] </td>
</tr>
<tr>
<td colspan='2' style='height:50px;line-height:27px;font-size:20px;vertical-align:bottom;' > [厂商名称]将於 [存货盘点民国日期] 进行例行性存货盘点,恳请协助清点敝公司借予 贵公司之存货品名及数量是否与下列明细相符,并盖章回传以兹证明。 </td>
</tr>
<tr>
<td colspan='2' style='height:40px;font-size:20px;' > 敬祝 商祺 </td>
</tr>
<tr>
<td colspan='2' style='height:30px;line-height:20px;font-size:20px;' > 此致 [厂商名称] </td>
</tr>
<tr>
<td colspan='2' style='font-size:20px;line-height:20px;' > 以下为截至 民国[函证民国日期] 为止,贵公司借用之存货明细: </td>
</tr>
<tr>
<td colspan='2' style='height:280px;vertical-align:top;font-size:20px;' >
<table style='border:1px solid #000000; width:100%;' cellpadding='0' cellspacing='0'>
<tr>
<td style='border:1px solid #000000;text-align:center;font-size:20px;'>No</td>
<td style='border:1px solid #000000;text-align:center;font-size:20px;'>品号</td>
<td style='border:1px solid #000000;text-align:center;font-size:20px;'>品名</td>
<td style='border:1px solid #000000;text-align:center;font-size:20px;'>数量</td>
</tr>
</table>
</td>
</tr>
<tr>
<td colspan='2' style='font-size:20px;' > 确认无误,特此证明。 </td>
</tr>
<tr>
<td colspan='2' style='height:200px; ' >
<div style='float:right;'>
<table style='border:1px solid #000000; ' cellpadding='0' cellspacing='0'>
<tr>
<td style='border:1px solid #000000;width:180px;height:180px;text-align:right; vertical-align:bottom;padding-bottom:10px;font-size:16px;'>经销商公司章</td>
<td style='border:1px solid #000000;width:180px;height:180px;text-align:right;vertical-align:bottom;padding-bottom:10px;font-size:16px;'>借用人签章</td>
</tr>
</table>
</div>
</td>
</tr>
<tr>
<td colspan='2' style='text-align:right;font-size:20px;' > 民国[函证民国日期] </td>
</tr>
<tr style='font-size:13px;height:50px;'>
<td colspan='2' style='color:#808080;font-size:16px; vertical-align:bottom;' > 经销商代号: 出借者工号: </td>
</tr>
</table>
该Html静态网页的执行内容
![]()
※补充说明,以上最外层的table容器宽度如果是固定宽度而非100%宽,Document物件又设为PageSize.A4的话,输出成PDF很可能会变这样↓
![]()
↑这种情况虽然调参数Document doc=new Document(PageSize.A3);即可解决,但比较通用的办法还是把最外层的容器宽度设为100%以符合PDF各种A4 、A3大小的宽度
?
接下来在专案中加入一个自订类别UnicodeFontFactory.cs,待会输出PDF时要使用此类别来解决XMLWorkerHelper不支援中文字问题
![]()
UnicodeFontFactory.cs代码完整内容
using iTextSharp.text;
using iTextSharp.text.pdf;
using iTextSharp.tool.xml;
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
using System.Web; public class UnicodeFontFactory : FontFactoryImp
{ private static readonly string arialFontPath = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts),
"arialuni.ttf");//arial unicode MS是完整的unicode字型。
private static readonly string 标楷体Path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts),
"KAIU.TTF");//标楷体 public override Font GetFont(string fontname, string encoding, bool embedded, float size, int style, BaseColor color,
bool cached)
{
//可用Arial或标楷体,自己选一个
BaseFont baseFont = BaseFont.CreateFont(标楷体Path, BaseFont.IDENTITY_H, BaseFont.EMBEDDED);
return new Font(baseFont, size, style, color);
} }
而在HomeController里,Html转PDF的完整范例代码
using iTextSharp.text;
using iTextSharp.text.pdf;
using iTextSharp.tool.xml;
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net;
using System.Text;
using System.Web;
using System.Web.Mvc; namespace MvcApplicationPDF.Controllers
{
public class HomeController : Controller
{ /// <summary>
/// 执行此Url,下载PDF档案
/// </summary>
/// <returns></returns>
public ActionResult DownloadPdf()
{
WebClient wc = new WebClient();
//从网址下载Html字串
string htmlText = wc.DownloadString("http://localhost:3056/Preview.html");
byte[] pdfFile = this.ConvertHtmlTextToPDF(htmlText); return File(pdfFile, "application/pdf", "范例PDF档.pdf");
}
/// <summary>
/// 将Html文字 输出到PDF档里
/// </summary>
/// <param name="htmlText"></param>
/// <returns></returns>
public byte[] ConvertHtmlTextToPDF(string htmlText)
{
if (string.IsNullOrEmpty(htmlText))
{
return null;
}
//避免当htmlText无任何html tag标签的纯文字时,转PDF时会挂掉,所以一律加上<p>标签
htmlText = "<p>" + htmlText + "</p>"; MemoryStream outputStream = new MemoryStream();//要把PDF写到哪个串流
byte[] data = Encoding.UTF8.GetBytes(htmlText);//字串转成byte[]
MemoryStream msInput = new MemoryStream(data);
Document doc = new Document();//要写PDF的文件,建构子没填的话预设直式A4
PdfWriter writer = PdfWriter.GetInstance(doc, outputStream);
//指定文件预设开档时的缩放为100%
PdfDestination pdfDest = new PdfDestination(PdfDestination.XYZ, 0, doc.PageSize.Height, 1f);
//开启Document文件
doc.Open();
//使用XMLWorkerHelper把Html parse到PDF档里
XMLWorkerHelper.GetInstance().ParseXHtml(writer, doc, msInput, null, Encoding.UTF8, new UnicodeFontFactory());
//将pdfDest设定的资料写到PDF档
PdfAction action = PdfAction.GotoLocalPage(1, pdfDest, writer);
writer.SetOpenAction(action);
doc.Close();
msInput.Close();
outputStream.Close();
//回传PDF档案
return outputStream.ToArray(); } }
}
执行结果:
![]()
结语
将Html转成PDF,使用Pechkin或iTextSharp各有优缺点
画面呈现当然是Pechkin比较忠於原始网页(因为采用Webkit引擎),如果没要进一步控制PDF档案功能的话,可使用Pechkin
如果要进一步控制PDF功能而且画面只是单纯的白纸黑字,就可以改用iTextSharp套件
参考文章
Display Unicode characters in converting Html to Pdf
How to set a default zoom percent to “100%” using iTextSharp 4.0.2?
[ASP.net MVC] 将HTML转成PDF档案,使用iTextSharp套件的XMLWorkerHelper (附上解决显示中文问题)的更多相关文章
- ASP.NET MVC 3 loginUrl自动变成Account/Login,并且发生404错误的解决方法
http://www.cnblogs.com/think8848/archive/2011/07/08/2100814.html ASP.NET MVC 3 loginUrl自动变成Account/L ...
- 基于ITextSharp插件在ASP.NET MVC中将图表导出为PDF
样本: 在这个示例中,我们使用的是微软给我们提供的数据库,也就是家喻户晓的Northwind数据库.要下载Microsoft的免费样本Northwind数据库,您需要访问以下URL.下载Northwi ...
- asp.net mvc(一) ----------简单封装成通用的List<T>集合
asp.net mvc(一) 这些天开始学习asp.net mvc,用传统的asp.net已经快四的年了,刚开始接触asp.net mvc确认感觉有点不适应,主要体现在asp.net mvc的实现上. ...
- 【精品分享二】ASP.NET MVC系列精品图书高清PDF下载
更多图书请关注:第一教育云电子书平台 http://book.1eduyun.com/ 注:本专题提供的所有的电子书下载资源均系收集于百度云,本网站(http://book.1eduyun.com/ ...
- ASP.NET MVC 项目直接预览PDF文件
背景及需求 项目使用的是MVC4框架,其中有一个功能是根据设置生成PDF文件,并在点击时直接预览. 实现过程 1.第一版实现代码: HTML内容 @{ Layout = null; } <!DO ...
- 【ASP.NET MVC】"[A]System.Web.WebPages.Razor.Configuration.HostSection 无法强制转换为 ..."的解决办法
1.错误页面: “/”应用程序中的服务器错误. [A]System.Web.WebPages.Razor.Configuration.HostSection 无法强制转换为 [B]System.Web ...
- ASP.NET MVC 5 - 验证编辑方法(Edit method)和编辑视图(Edit view)
在本节中,您将验证电影控制器生成的编辑方法(Edit action methods)和视图.但是首先将修改点代码,使得发布日期属性(ReleaseDate)看上去更好.打开Models \ Movie ...
- ASP.NET MVC 5– 使用Wijmo MVC 5模板1分钟创建应用
开始使用 使用ComponentOne Studio for ASP.NET Wijmo制作MVC5应用程序,首先要做的是安装Studio for ASP.NET Wijmo . 测试环境 VS201 ...
- ASP.NET MVC 5 - 查询Details和Delete方法
在这部分教程中,接下来我们将讨论自动生成的Details和Delete方法. 查询Details和Delete方法 打开Movie控制器并查看Details方法. public ActionResul ...
随机推荐
- Java学习笔记 05 数据包装类
一.包装类 综述 >>java.lang包中的Integer类.Long类和Short类,分别将基本数据类型int.long和short封装成一个类.这些类都是Number的子类. Int ...
- SpringMVC常用注解實例詳解2:@ModelAttribute
我的開發環境框架: springmvc+spring+freemarker開發工具: springsource-tool-suite-2.9.0JDK版本: 1.6.0_29tomcat ...
- zabbix利用mutt和msmtp配置邮件报警
Mutt安装 yum –y install mutt msmtp安装 yum –y install openssl openssl-devel libntlm libntlm-devel cyrus- ...
- Python socket (单线程)
client, 客户端 code : 客户端主要方法, s.send(); s.sendall(); s.recv(); s.connect() class Client(object): def _ ...
- 用户 'IIS APPPOOL\ASP.NET V4.0' 登录失败 解决办法…………
在iis管理器中-->应用程序池-->ASP.NET V4.0---->高级设置-->标识-->改为localSystem
- android目录介绍
- iOS开发零基础--Swift教程 字典
字典的介绍 字典允许按照某个键来访问元素 字典是由两部分集合构成的,一个是键(key)集合,一个是值(value)集合 键集合是不能有重复元素的,而值集合是可以重复的,键和值是成对出现的 Swift中 ...
- 如何参与Linux内核开发(转)
本文来源于linux内核代码的Document文件夹下的Hoto文件.Chinese translated version of Documentation/HOWTO If you have any ...
- mysql5.7中文乱码问题的解决,将编码统一改成utf8的方法
修改配置文件my.ini 将其改为:(路径根据自己mysql的安装路径进行适当调整,与字符编码无关,不必改动) [mysqld] basedir=C:\MYSQL57datadir=C:\MYSQL5 ...
- Razor 中的@helper 与 @function 用法
@helper : 可以有返回值,也可以没有返回值 @function :需要有返回值 可以将View中公共部分的代码抽取出来,变成一个独立的方法 公共部分 view 抽出的公共部分 ...