很多扫描版的电子书,留有很大的页边距,大屏的设备看起来没有啥影响,
可是在kindle上看起来就麻烦了,放大操作简直就没法用,最好能把留白去掉。

  1. 将pdf文件转换为图片
    这个看看 例子里的 JpegDevice就可以了
  2. 设置需要裁剪的区域
    首先将图片显示在pictureBox上,然后用鼠标画个差不多的框就可以了,
    可能有方法识别书籍的内容区,那个我不会。
    潜在的问题是有的书籍扫描得不是很好,偏得比较多,可能会导致内容被删除,
  3. 将图片组装为pdf书
    有个特殊的地方是dpi问题,
    计算像素的时候,Aspose.Pdf好像用的是72,但是每个人的情况不一样,需要做个转换。
    int pageCount = pdfDocument.Pages.Count;
                Resolution resolution = new Resolution(300);
                if (pageCount == 0)
                {
                    return;
                }
    
                float dpiX = 72;
                float dpiY = 72;
                using (Graphics graphics = Graphics.FromHwnd(IntPtr.Zero))
                {
                    dpiX = graphics.DpiX;
                    dpiY = graphics.DpiY;
                }
    
                int pageWidth = rect.Width;
                float secPageWidth = (float)(pageWidth * 72 / dpiX);
                float secPageHeight = (float)(pdfDocument.PageInfo.Height * 72 / dpiY);
                System.Drawing.Rectangle clipRect = new System.Drawing.Rectangle(rect.X, 0, rect.Width, (int)pdfDocument.PageInfo.Height);
    
                JpegDevice jpegDevice = new JpegDevice((int)pdfDocument.PageInfo.Width,
                   (int)pdfDocument.PageInfo.Height, resolution, 100);
                for (int i = 1; i <= pageCount; i++)
                {
    
                    Aspose.Pdf.Generator.Section imageSection = newPdfFileDocument.Sections.Add();
                    imageSection.PageInfo.PageWidth = secPageWidth;
                    imageSection.PageInfo.PageHeight = secPageHeight;
    
                    Aspose.Pdf.Generator.MarginInfo marginInfo = new Aspose.Pdf.Generator.MarginInfo();
                    marginInfo.Bottom = 0;
                    marginInfo.Left = 0;
                    marginInfo.Right = 0;
                    marginInfo.Top = 0;
                    imageSection.PageInfo.Margin = marginInfo;
    
                    Aspose.Pdf.Generator.Image imagePdfContent = new Aspose.Pdf.Generator.Image(imageSection);
                    imageSection.Paragraphs.Add(imagePdfContent);
                    imagePdfContent.ImageInfo.ImageFileType = Aspose.Pdf.Generator.ImageFileType.Jpeg;
    
                    MemoryStream msSrcImg = new MemoryStream();
                    jpegDevice.Process(pdfDocument.Pages[i], msSrcImg);
                    System.Drawing.Image image = System.Drawing.Image.FromStream(msSrcImg);
                    System.Drawing.Bitmap bmpImage = new System.Drawing.Bitmap(image);
                    System.Drawing.Bitmap bmpCrop = bmpImage.Clone(clipRect, bmpImage.PixelFormat);
    
                    MemoryStream msCropImg = new MemoryStream();
                    bmpCrop.Save(msCropImg, ImageFormat.Jpeg);
                    imagePdfContent.ImageInfo.ImageStream = msCropImg;
                    GC.Collect();
                }
    

      

利用Aspose.Pdf将扫描的电子书修改为适合在kindle上查看的更多相关文章

  1. Asp.net MVC 利用(aspose+pdfobject.js) 实现在线预览word、excel、ppt、pdf文件

    在线预览word.excel.ppt利用aspose动态生成html 主要代码 private bool OfficeDocumentToHtml(string sourceDoc, string s ...

  2. 【.Net 学习系列】-- 利用Aspose转换Excel为PDF文件

    功能: 从数据库中查询出数据 利用Aspose.cell + Excel模板绑定数据源生成Excel文件 通过Aspose.pdf + 生成好的Excel生成PDF文件 实现: 查询数据,根据Exce ...

  3. 利用Aspose.Word控件和Aspose.Cell控件,实现Word文档和Excel文档的模板化导出

    我们知道,一般都导出的Word文档或者Excel文档,基本上分为两类,一类是动态生成全部文档的内容方式,一种是基于固定模板化的内容输出,后者在很多场合用的比较多,这也是企业报表规范化的一个体现. 我的 ...

  4. 利用Aspose文档转图片

    通过使用Aspose您可以轻松的将您的文档转换成真正的图片格式,最好的保证您的内容将实际可见,与其他格式相比,它并不存在查看工具的安装问题. 准备工作: 1:下载Aspose组件包:http://do ...

  5. 利用Aspose.Cell控件导入Excel非强类型的数据

    导入Excel的操作是非常常见的操作,可以使用Aspose.Cell.APOI.MyXls.OLEDB.Excel VBA等操作Excel文件,从而实现数据的导入,在导入数据的时候,如果是强类型的数据 ...

  6. Magento PDF发票,支持中文,以及修改的办法

    Magento PDF发票,支持中文,以及修改的办法.   如果让magento的PDF发票支持中文.Magento生成PDF发票.使用的是zend framework的zend_pdf类. 下面是一 ...

  7. 【分享】改变未来的九大算法[pdf][清晰扫描版]

    [下载地址]http://www.colafile.com/file/1179688 图书信息:中文名: 改变未来的九大算法作者: 约翰·麦考密克译者: 管策图书分类: 软件资源格式: PDF版本: ...

  8. Pdf文件处理组件对比(Aspose.Pdf,Spire.Pdf,iText7)

    目的 因为公司是做医疗相关软件的,所以经常和文档打交道,其中就包含了Pdf.医院的Pdf(通常是他们的报告)都千奇百怪,而我们一直以来都是在用一些免费且可能已经没人维护了的组件来处理Pdf,所以就经常 ...

  9. App阅读pdf和扫描二维码功能

    在之前开发的Android手机App中,需要实现阅读pdf和扫描二维码的功能,在github 上找到大牛封装好包,亲测可用. 阅读pdf: https://github.com/barteksc/An ...

随机推荐

  1. Android AChartEngine 饼图渐变效果

    二话不说,先上图 核心代码如下: private void initLabelChat(View rootView) { NumberFormat nf = new DecimalFormat(&qu ...

  2. Python从线程获取函数返回值

    Python中利用强大的threading模块可以很容易的实现多线程开发,提高运行速度.这一般是对某个进行大量计算操作的的函数进行多线程处理,然后合并各线程的结果.获取函数返回值的方法可以如下: 1) ...

  3. sysbench压力测试工具简介和使用(二)

    sysbench压力测试工具使用: 2.1    测试数据库服务器的硬件配置信息如下: CPU:      24核心线程数,Intel(R) Xeon(R) CPU E5-2620 0 @ 2.00G ...

  4. linux查找日志技巧

    对于从事web开发的人员来说.服务器上的日志多如牛毛,如何快速从中找出所需信息非常重要,以下是我在工作中用到的查找日志的简单命令,希望能对您有所帮助:   工具/原料   linux SecureCR ...

  5. Oauth2.0

    注:Access token 为第三方平台的token,在用户授权时使用Refresh Token为用户的token get/post参数时,一般采用字典排序

  6. WPF 绑定的校验

    为进行校验,必须准备一个RangeValidationRule类,该类继承自ValidationRule 该类实现如下: class RangeValidationRule : ValidationR ...

  7. python 脚本中使用了第三方openpyxl 打包程序运行提示ImportError:cannot import name __version__

    最近写了一个脚本,脚本中使用了第三方openpyxl(openpyxl是使用 pip install openpyxl 下载的),先是使用py2exe打包程序,打包过程中提示很多文件没有包含,在没有仔 ...

  8. 巧用freemarker

    使用Freemarker宏进行可扩展式模块化编程 该文是转载而来,并非我本人所写,但是觉得真心不错,所以收藏一下 一.前言 今天的文章聊一下freemarker的一些特性:宏,我们将使用它写出一些模块 ...

  9. Excel 执行Sql 将查询结果输出到EXCEL指定位置

    Dim cnn,strSql Set cnn = CreateObject("adodb.connection") cnn.Open "driver={sql serve ...

  10. Html注册表单示例

    注册表单示例,出自<网页开发手记:Html,CSS,JavaScript实战详解>.   <html>   <head>   <title>注册表单&l ...