很多扫描版的电子书,留有很大的页边距,大屏的设备看起来没有啥影响,
可是在kindle上看起来就麻烦了,放大操作简直就没法用,最好能把留白去掉。

  1. 将pdf文件转换为图片
    这个看看 例子里的 JpegDevice就可以了
  2. 设置需要裁剪的区域
    首先将图片显示在pictureBox上,然后用鼠标画个差不多的框就可以了,
    可能有方法识别书籍的内容区,那个我不会。
    潜在的问题是有的书籍扫描得不是很好,偏得比较多,可能会导致内容被删除,
  3. 将图片组装为pdf书
    有个特殊的地方是dpi问题,
    计算像素的时候,Aspose.Pdf好像用的是72,但是每个人的情况不一样,需要做个转换。
    int pageCount = pdfDocument.Pages.Count;
                Resolution resolution = new Resolution(300);
                if (pageCount == 0)
                {
                    return;
                }
    
                float dpiX = 72;
                float dpiY = 72;
                using (Graphics graphics = Graphics.FromHwnd(IntPtr.Zero))
                {
                    dpiX = graphics.DpiX;
                    dpiY = graphics.DpiY;
                }
    
                int pageWidth = rect.Width;
                float secPageWidth = (float)(pageWidth * 72 / dpiX);
                float secPageHeight = (float)(pdfDocument.PageInfo.Height * 72 / dpiY);
                System.Drawing.Rectangle clipRect = new System.Drawing.Rectangle(rect.X, 0, rect.Width, (int)pdfDocument.PageInfo.Height);
    
                JpegDevice jpegDevice = new JpegDevice((int)pdfDocument.PageInfo.Width,
                   (int)pdfDocument.PageInfo.Height, resolution, 100);
                for (int i = 1; i <= pageCount; i++)
                {
    
                    Aspose.Pdf.Generator.Section imageSection = newPdfFileDocument.Sections.Add();
                    imageSection.PageInfo.PageWidth = secPageWidth;
                    imageSection.PageInfo.PageHeight = secPageHeight;
    
                    Aspose.Pdf.Generator.MarginInfo marginInfo = new Aspose.Pdf.Generator.MarginInfo();
                    marginInfo.Bottom = 0;
                    marginInfo.Left = 0;
                    marginInfo.Right = 0;
                    marginInfo.Top = 0;
                    imageSection.PageInfo.Margin = marginInfo;
    
                    Aspose.Pdf.Generator.Image imagePdfContent = new Aspose.Pdf.Generator.Image(imageSection);
                    imageSection.Paragraphs.Add(imagePdfContent);
                    imagePdfContent.ImageInfo.ImageFileType = Aspose.Pdf.Generator.ImageFileType.Jpeg;
    
                    MemoryStream msSrcImg = new MemoryStream();
                    jpegDevice.Process(pdfDocument.Pages[i], msSrcImg);
                    System.Drawing.Image image = System.Drawing.Image.FromStream(msSrcImg);
                    System.Drawing.Bitmap bmpImage = new System.Drawing.Bitmap(image);
                    System.Drawing.Bitmap bmpCrop = bmpImage.Clone(clipRect, bmpImage.PixelFormat);
    
                    MemoryStream msCropImg = new MemoryStream();
                    bmpCrop.Save(msCropImg, ImageFormat.Jpeg);
                    imagePdfContent.ImageInfo.ImageStream = msCropImg;
                    GC.Collect();
                }
    

      

利用Aspose.Pdf将扫描的电子书修改为适合在kindle上查看的更多相关文章

  1. Asp.net MVC 利用(aspose+pdfobject.js) 实现在线预览word、excel、ppt、pdf文件

    在线预览word.excel.ppt利用aspose动态生成html 主要代码 private bool OfficeDocumentToHtml(string sourceDoc, string s ...

  2. 【.Net 学习系列】-- 利用Aspose转换Excel为PDF文件

    功能: 从数据库中查询出数据 利用Aspose.cell + Excel模板绑定数据源生成Excel文件 通过Aspose.pdf + 生成好的Excel生成PDF文件 实现: 查询数据,根据Exce ...

  3. 利用Aspose.Word控件和Aspose.Cell控件,实现Word文档和Excel文档的模板化导出

    我们知道,一般都导出的Word文档或者Excel文档,基本上分为两类,一类是动态生成全部文档的内容方式,一种是基于固定模板化的内容输出,后者在很多场合用的比较多,这也是企业报表规范化的一个体现. 我的 ...

  4. 利用Aspose文档转图片

    通过使用Aspose您可以轻松的将您的文档转换成真正的图片格式,最好的保证您的内容将实际可见,与其他格式相比,它并不存在查看工具的安装问题. 准备工作: 1:下载Aspose组件包:http://do ...

  5. 利用Aspose.Cell控件导入Excel非强类型的数据

    导入Excel的操作是非常常见的操作,可以使用Aspose.Cell.APOI.MyXls.OLEDB.Excel VBA等操作Excel文件,从而实现数据的导入,在导入数据的时候,如果是强类型的数据 ...

  6. Magento PDF发票,支持中文,以及修改的办法

    Magento PDF发票,支持中文,以及修改的办法.   如果让magento的PDF发票支持中文.Magento生成PDF发票.使用的是zend framework的zend_pdf类. 下面是一 ...

  7. 【分享】改变未来的九大算法[pdf][清晰扫描版]

    [下载地址]http://www.colafile.com/file/1179688 图书信息:中文名: 改变未来的九大算法作者: 约翰·麦考密克译者: 管策图书分类: 软件资源格式: PDF版本: ...

  8. Pdf文件处理组件对比(Aspose.Pdf,Spire.Pdf,iText7)

    目的 因为公司是做医疗相关软件的,所以经常和文档打交道,其中就包含了Pdf.医院的Pdf(通常是他们的报告)都千奇百怪,而我们一直以来都是在用一些免费且可能已经没人维护了的组件来处理Pdf,所以就经常 ...

  9. App阅读pdf和扫描二维码功能

    在之前开发的Android手机App中,需要实现阅读pdf和扫描二维码的功能,在github 上找到大牛封装好包,亲测可用. 阅读pdf: https://github.com/barteksc/An ...

随机推荐

  1. C# 图片流下载;图片流输出

    图片流下载 string filePath = HttpContext.Current.Server.MapPath("/img/wxPic/"); if (!Directory. ...

  2. loss function与cost function

    实际上,代价函数(cost function)和损失函数(loss function 亦称为 error function)是同义的.它们都是事先定义一个假设函数(hypothesis),通过训练集由 ...

  3. Spark Netty与Jetty (源码阅读十一)

    spark呢,对Netty API又做了一层封装,那么Netty是什么呢~是个鬼.它基于NIO的服务端客户端框架,具体不再说了,下面开始. 创建了一个线程工厂,生成的线程都给定一个前缀名. 像一般的n ...

  4. es let2

    <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title> ...

  5. 安装SQL提示重启电脑失败,解决办法

    1. 打开注册表, 找到HKEY_LOCAL_MACHINE-->software-->Microsof-->MSSQLServer...统统删掉 2.HKEY_LOCAL_MACH ...

  6. 使用Grunt 插件打包Electron Windows应用

    最近利用Electron来创建跨桌面应用的趋势似乎很火.看了几个用Electron开发的应用,这些应用在windows下面的安装方式,都是类似一个绿色软件的安装方法,下载.zip->解压到相应目 ...

  7. php中序列化与反序列化

    解析PHP多种序列化与反序列化的方法 序列化是将变量转换为可保存或传输的字符串的过程:反序列化就是在适当的时候把这个字符串再转化成原来的变量使用.这两个过程结合起来,可以轻松地存储和传输数据,使程序更 ...

  8. d3安装异常

    使用npm安装D3,发现其工程名和依赖名重复,导致安装异常 http://thisdavej.com/node-newbie-error-npm-refusing-to-install-package ...

  9. Delphi 查找标题已知的窗口句柄,遍历窗口控件句柄(转)

    用我的方法来控制其他程序窗体上的窗口控件,必须先了解什么是 回调函数.我的理解是这样的: 回 调函数写出来不是自己的程序去调用的,反而是让其他的东西去调用,比如windows操作系统,比如其他的程序等 ...

  10. [转]Amazon DynamoDB – a Fast and Scalable NoSQL Database Service Designed for Internet Scale Applications

    This article is from blog of Amazon CTO Werner Vogels. -------------------- Today is a very exciting ...