PDF文档导出

代码如下：

/// <summary>

/// 获取html内容，转成PDF(注册)

/// </summary>

public void DownloadPDFByHTML(string html,string FileName)

{

WebClient wc = new WebClient();

//

wc.Encoding = System.Text.Encoding.UTF8;

//string htmlText = getWebContent();

string htmlText = html;//getWebContent();

string DataName = FileName;//下载文件名

byte[] pdfFile =ConvertHtmlTextToPDF(htmlText);

//如果需要保存到服务器

//string fileId = "/file_" + DateTime.Now.ToString("yyyyMMddHHmmss") + ".pdf";

//System.IO.File.WriteAllBytes(path + fileId, pdfFile);

Response.ContentType = "application/octet-stream";

//通知浏览器下载文件

Response.AddHeader("Content-Disposition", "attachment; filename=" + HttpUtility.UrlEncode(DataName + ".pdf", System.Text.Encoding.UTF8));

Response.BinaryWrite(pdfFile);//文件下载二进制流

Response.Flush();

Response.End();

////删除服务器文件，通知下载成功之后，删除

//FileInfo fi = new FileInfo(path + fileId);

//if (fi.Exists)

//{

// fi.Delete();

//}

}

/// <summary>

/// 获取网站内容，包含了 HTML+CSS+JS

/// </summary>

/// <returns>String返回网页信息</returns>

public string getWebContent()

{

try

{

string INPATH = System.Web.HttpContext.Current.Server.MapPath("~/EmailTemplet/sa.html");

WebClient MyWebClient = new WebClient();

MyWebClient.Credentials = CredentialCache.DefaultCredentials;

//获取或设置用于向Internet资源的请求进行身份验证的网络凭据

Byte[] pageData = MyWebClient.DownloadData(INPATH);

//从指定网站下载数据

string pageHtml = Encoding.UTF8.GetString(pageData);

//如果获取网站页面采用的是GB2312，则使用这句

bool isBool =isMessyCode(pageHtml);//判断使用哪种编码 读取网页信息

if (!isBool)

{

string pageHtml1 = Encoding.UTF8.GetString(pageData);

pageHtml = pageHtml1;

}

else

{

string pageHtml2 = Encoding.Default.GetString(pageData);

pageHtml = pageHtml2;

}

return pageHtml;

}

catch (WebException webEx)

{

Console.WriteLine(webEx.Message.ToString());

return webEx.Message;

}

}

/// <summary>

/// 判断是否有乱码

/// </summary>

/// <param name="txt"></param>

/// <returns></returns>

public static bool isMessyCode(string txt)

{

var bytes = Encoding.UTF8.GetBytes(txt);

for (var i = 0; i < bytes.Length; i++)

{

if (i < bytes.Length - 3)

if (bytes[i] == 239 && bytes[i + 1] == 191 && bytes[i + 2] == 189)

{

return true;

}

}

return false;

}

/// <summary>

/// 将Html文字 输出到PDF档里

/// </summary>

/// <param name="htmlText"></param>

/// <returns></returns>

public static byte[] ConvertHtmlTextToPDF(string htmlText)

{

if (string.IsNullOrEmpty(htmlText))

{

return null;

}

//避免当htmlText无任何html tag标签的纯文字时，转PDF时会挂掉，所以一律加上<p>标签

//htmlText = "<p>" + htmlText + "</p>";

MemoryStream outputStream = new MemoryStream();//要把PDF写到哪个串流

byte[] data = Encoding.UTF8.GetBytes(htmlText);//字串转成byte[]

MemoryStream msInput = new MemoryStream(data);

Document doc = new Document(PageSize.A4.Rotate(), 1, 1, 1, 1);//要写PDF的文件，建构子没填的话预设直式A4（括号内不填写值默认是A4纵向，否则是横向）

PdfWriter writer = PdfWriter.GetInstance(doc, outputStream);

//指定文件预设开档时的缩放为100%

PdfDestination pdfDest = new PdfDestination(PdfDestination.XYZ, 0, doc.PageSize.Height, 1f);

//开启Document文件

doc.Open();

doc.Add(iTextSharp.text.PageSize.A5.Rotate());

//使用XMLWorkerHelper把Html parse到PDF档里

XMLWorkerHelper.GetInstance().ParseXHtml(writer, doc, msInput, null, Encoding.UTF8, new UnicodeFontFactory());

//XMLWorkerHelper.GetInstance().ParseXHtml(writer, doc, msInput, null, Encoding.UTF8);

//将pdfDest设定的资料写到PDF档

PdfAction action = PdfAction.GotoLocalPage(1, pdfDest, writer);

writer.SetOpenAction(action);

doc.Close();

msInput.Close();

outputStream.Close();

//回传PDF档案

return outputStream.ToArray();

}

//设置字体类 (如果字体设置有问题，只能显示英文)

public class UnicodeFontFactory : FontFactoryImp

{

private static readonly string arialFontPath = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts),

"arialuni.ttf");//arial unicode MS是完整的unicode字型。

private static readonly string FontTypePath = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Fonts),

"STKAITI.TTF");

public override Font GetFont(string fontname, string encoding, bool embedded, float size, int style, BaseColor color, bool cached)

{

BaseFont bfChiness = BaseFont.CreateFont(@"C:\\WINDOWS\\FONTS\\STKAITI.TTF", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);

//可用Arial或标楷体，自己选一个

BaseFont baseFont = BaseFont.CreateFont(FontTypePath, BaseFont.IDENTITY_H, BaseFont.EMBEDDED);

return new Font(bfChiness, size, style, color);

}

}

以上是代码，直接调用DownloadPDFByHTML()该方法，代码需要引用两个dll文件，itextsharp.dll和itextsharp.xmlworker.dll 下载

PDF文档导出的更多相关文章

将w3cplus网站中的文章页面提取并导出为pdf文档
最近在看一些关于CSS3方面的知识,主要是平时看到网页中有很多用CSS3实现的很炫的效果,所以就打算系统的学习一下.在网上找到很多的文章,但都没有一个好的整理性,比较凌乱.昨天看到w3cplus网站中 ...
ABBYY FineReader 15 中保存和导出PDF文档的小细节
运用ABBYY FineReader OCR文字识别软件,用户能将各种格式的PDF文档保存为新的PDF文档.PDF/A格式文档,以及Microsoft Word.Excel.PPT等格式.在保存与导出 ...
C#(MVC) Word 替换，填充表格，导出并下载PDF文档
近期做一个关于C# 操作 Word 模板文档的功能模块,查阅资料,最终完美完成任务,记录下来,以便后面还会用到.
利用Java动态生成 PDF 文档
利用Java动态生成 PDF 文档,则需要开源的API.首先我们先想象需求,在企业应用中,客户会提出一些复杂的需求,比如会针对具体的业务,构建比较典型的具备文档性质的内容,一般会导出PDF进行存档.那 ...
【Win10 开发】读取PDF文档
关于用来读取PDF文档的内容的API,其实在Win8.1的时候就有,不过没关系,既咱们讨论的是10的UAP,连同8.1的内容也包括进去,所以老周无数次强调:把以前的内容学好了,就可以在不学习任何新知识 ...
一起学微软Power BI系列-官方文档-入门指南(7)发布与共享-终结篇+完整PDF文档
接触Power BI的时间也只有几个月,虽然花的时间不多,但通过各种渠道了解收集,谈不上精通,但对一些重要概念和细节还是有所了解.在整理官方文档的过程中,也熟悉和了解了很多概念.所以从前到后把微软官方 ...
使用Spire PDF for .NET将HTML转换成PDF文档
目录开发环境说明 Spire PDF for .NET (free edition)体验资源下载开发环境说明 Microsoft Visual Studio 2013 Ultimate Edit ...
基于iTextSharp的PDF文档操作
公司是跨境电商,需要和各种物流打交道,需要把东西交给物流,让他们发到世界各地.其中需要物流公司提供一个运单号,来追踪货物到达哪里?! 最近在和DHL物流公司(应该是个大公司)对接,取运单号的方式是调用 ...
java操作office和pdf文件java读取word，excel和pdf文档内容
在平常应用程序中,对office和pdf文档进行读取数据是比较常见的功能,尤其在很多web应用程序中.所以今天我们就简单来看一下Java对word.excel.pdf文件的读取.本篇博客只是讲解简单应 ...

随机推荐

Mysql表中唯一编号的分配机制
最近遇到一个问题:高并发环境下,如何避免MYSQL一张表里的某些列不要重复. 同其他博友一样 https://blog.csdn.net/jacketinsysu/article/details/51 ...
向数据库中添加数据，通过se16 不能添加，通过代码可以添加的原因
1: 在向数据库中添加数据时,通过客户端se16 准备对数据表进行添加数据,提示如下: 找了以下原因,如下: https://www.baidu.com/link?url=3yRtAfY1_9XG ...
PHP策略模式1
[IUser.php] <?php /** * 策略模式 * 将一组特定的行为和算法封装成类,用来适应某些特定的上下文环境,实现从硬编码到解耦 * 应用举例:电商系统针对不同性别跳转到不同的商品 ...
[py]python __file__ 与argv[0]
http://andylin02.iteye.com/blog/933237 BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__ ...
Java中输出正则表达式匹配到的内容
import java.util.regex.Matcher; import java.util.regex.Pattern; public class A { public static void ...
Python复习基础篇
4.4 使用列表的一部分 Python切片(切片就是取值的呗) print(players[0:3]) 中括号,冒号隔开,顾头不顾尾. print([:4]) 从开始取还是会顾尾的 pri ...
[LeetCode] 111. Minimum Depth of Binary Tree_Easy tag:DFS
Given a binary tree, find its minimum depth. The minimum depth is the number of nodes along the shor ...
CentOS6.5 安装Spark集群
一.安装依赖软件Scala(所有节点) 1.下载Scala:http://www.scala-lang.org/files/archive/scala-2.10.4.tgz 2.解压: [root@H ...
Ubuntu16.04源的问题
今天执行下列语句 sudo apt-get update报错安装redis时 sudo apt-get install redis-server报错报错内容大致如下: 在网上查了一下是源的问题,我 ...
Oracle SPA取报告阶段xml解析失败解决方案
SPA的整体测试过程可以参考: 记录一则完整的SPA(10g->11g)测试过程故障描述:数据库字符集:US7ASCII,在SPA分析阶段正常,但在取报告阶段xml解析失败,具体现象如下: S ...

PDF文档导出

PDF文档导出的更多相关文章

随机推荐

热门专题