rtf乱码解决办法

首先，阐述下rtf，富文本格式文档，目前常用来做模板；

我遇到的问题是rtf中替换后的文本显示是正常的，rtf直接转pdf就不正常了，通过notpad++ 打开后发现rtf本身内容编码是我没有见过的（查资料说时ansi，具体我也不晓得了），我替换后的则是中文显示，这样转换后中文全部乱码；

解决办法如下，直接贴util类分享

package com.ywlqi.util;

public class StringToRtfUtil{

    public static String chineseStrTortf(String content){

        StringBuffer sb = new StringBuffer("");

        if (content == null) return null;

        for (char c : content.toCharArray()) {

             if(isChinese(c)){

                 System.out.println(c);

                 sb.append(strToRtf(String.valueOf(c)));

             }else{

                 sb.append(c);

             }

        }

        return sb.toString();

    }

    public static void main(String[] args) {

        System.out.println(chineseStrTortf("1）在合同有效期内，乙方为甲方提供简历库下载的用户名与初始密码"));

    }

    public static byte[] charToByte(char c) {

        byte[] b = new byte[2];

        b[0] = (byte) ((c & 0xFF00) >> 8);

        b[1] = (byte) (c & 0xFF); 

        return b;

    }

    public static boolean isChinese(char c) {

//          return c >= 0x4E00 &&  c <= 0x9FA5;// 根据字节码判断

          Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);

            if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS

                    || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B

                    || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS

                    || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {

                return true;

            }

            return false;

    }

    public static String strToRtf(String content) {

        StringBuffer sb = new StringBuffer("");

        try {

            char[] digital = "0123456789ABCDEF".toCharArray();

            byte[] bs = null;

            bs = content.getBytes("GB2312");

            int bit;

            for (int i = 0; i < bs.length; i++) {

                bit = (bs[i] & 0x0f0) >> 4;

                sb.append("\\'");

                sb.append(digital[bit]);

                bit = bs[i] & 0x0f;

                sb.append(digital[bit]);

            }

        } catch (Exception e) {

            e.printStackTrace();

        }

        return sb.toString();

    }

    public static String byteToRtf(byte[] bs) {

        StringBuffer sb = new StringBuffer("");

        try {

            char[] digital = "0123456789ABCDEF".toCharArray();

            int bit;

            for (int i = 0; i < bs.length; i++) {

                bit = (bs[i] & 0x0f0) >> 4;

                sb.append("\\'");

                sb.append(digital[bit]);

                bit = bs[i] & 0x0f;

                sb.append(digital[bit]);

            }

        } catch (Exception e) {

            e.printStackTrace();

        }

        return sb.toString();

    }

}

在模板替换的时候使用

chineseStrTortf或者strToRtf即可，两者区别在于，你是把所有字符串转成rtf编码还是仅转换中文

rtfTemplate.put("value_taxAddr", StringToRtfUtil.strToRtf(taxAddr));

这样rtf文档显示正常，pdf也是正常的

rtf乱码解决办法的更多相关文章

[Linux] - CentOS中文乱码解决办法
CentOS 7 终端中文乱码解决办法: 1.使用vim编辑locale.config文件: vim /etc/locale.conf 2.将LANG="en_US.UTF-8"修 ...
爬虫爬数据时，post数据乱码解决办法
最近在写一个爬虫,目标网站是:http://zx.bjmemc.com.cn/,可能是为了防止被爬取数据,它给自身数据加了密.用谷歌自带的抓包工具也不能捕获到数据.于是下了Fiddler. F ...
Oracle导入中文乱码解决办法
Oracle导入中文乱码解决办法一.确保各个客户端字符集的编码同服务器字符集编码一致 1- 确定sqlplus字符集编码,如果是windows设置环境变量. 2- 确保Sec ...
NetBeans中文乱码解决办法
一.Windows下NetBeans中文乱码解决办法找到你的Netbeans安装目录下的etc文件夹,用记事本打开netbeans.conf,找到netbeans_default_options(不 ...
uploadify上传控件中文的乱码解决办法
uploadify上传控件中文的乱码解决办法网站用的gb2312的编码,用uploadify上传控件上传中文时在IE能部分成功,FF,Chrome则完全失败,查找了一天原因,结果发现是页面编码问题, ...
centos7.2中文乱码解决办法
centos7.2 中文乱码解决办法 1.查看安装中文包: 查看系统是否安装中文语言包 (列出所有可用的公共语言环境的名称,包含有zh_CN) # locale -a |grep "zh_C ...
Source Insight 中文注释为乱码解决办法（完美解决，一键搞定）
我从网上查了一堆解决办法,但是都是2017年以前的解决方案,并且都是针对于source insight 3.5及以下版本的,目前SI软件版本都到4.0了,应该有新方法出现了. ------------ ...
Testng生成的测试报告乱码解决办法
Testng生成的测试报告乱码解决办法 2017-06-16 1 问题描述乱码是程序编码不统一,比如Java源代码是utf-8,编译是gbk,这时会乱码. 代码如下: org.testng.Repo ...
windows下git bash中文乱码解决办法
一.解决办法1:(直接上图) 1.在git bash下,右键出现下图,选择options: 2.选择“Text” 3.将“Character set”设置为 UTF-8 转:windows下git ...

随机推荐

encodeURIComponent 和 decodeURIComponent 对字符串url编码用于url拼字符传值
tp5命令行
手册->命令行->自定义命令行 1.第一步,配置command.php文件 2.第二步,建立命令类文件注意:该文件中代码,从文档中粘,以防写错. 名字啥的都不用改,就改命名空间和定义 ...
算法题：int 数组中只有一个是id 只出现一次其他都出现2次怎么找出只出现一次的id
首先讲一个最笨的算法:时间复杂度为N 空间复杂度为N 代码如下:输出结果id=3完全正确: int[] a = new int[] { 1, 1, 2, 2, 3, 4, 4 }; Dictiona ...
warnings.warn("allowed_domains accepts only domains, not URLs. Ignoring URL entry %s in allowed_doma
多页面循环爬取数据抛出如下异常 warnings.warn("allowed_domains accepts only domains, not URLs. Ignoring URL ent ...
主线程 RunLoop 学习笔记
以下为主RunLoop 的输出,能够看到不同的source0,source1,observer ---------------------------------- CFRunLoop{wakeup ...
sitecore 获取item的URL
给出一个简单的sitecore项: Item item; 该项目本身不包含它的网址.要获取项目的URL,您需要调用static类Sitecore.Links.LinkManager string ur ...
模板std::mutex用法：
std::mutex mymutex; std::lock_guard<std::mutex> lock(mymutex);
Vim搜索、取消高亮、显示行数、取消行数
1.显示行数 :set nu 2.取消行号 :set nu! 3.高亮搜索 /target 4.取消高亮 :noh
python 2 和 python 3 的区别
p2:重复代码语言不统一不支持中文input() 输入数字获取数字输入字符串必须自己手动写引号raw_input 和p3中的 input 一样print可以加括号也可以不加括号p2 中除法获取到的 ...
tensorflow学习笔记1：导出和加载模型
用一个非常简单的例子学习导出和加载模型: 导出写一个y=a*x+b的运算,然后保存graph: import tensorflow as tf from tensorflow.python.fram ...

rtf乱码解决办法

rtf乱码解决办法的更多相关文章

随机推荐

热门专题