InputStream 读取中文乱码扩展

对于InputStream读取中文乱码，下面这段话给出了很好的解释，以及后续编码上的扩展。

BufferedInputStream和BufferedOutputStream是过滤流，需要使用已存在的节点来构造。

即必须先有InputStream或OutputStream，相对直接读写，这两个流提供带缓存的读写，提高了系统读写效率性能。

BufferedInputStream读取的是字节byte，因为一个汉字占两个字节，而当中英文混合的时候，有的字符占一个字节，有的字符占两个字节。

所以如果直接读字节，而数据比较长，没有一次读完的时候，很可能刚好读到一个汉字的前一个字节，这样，这个中文就成了乱码，后面的数据因为没有字节对齐，也都成了乱码。

所以我们需要用BufferedReader来读取，它读到的是字符，所以不会读到半个字符的情况，不会出现乱码。

 package com.read;

 import java.io.*;

 /**

  *千字文.txt 在 classpath 用来测试

  */

 public class Main {

     public static void main(String[] args) {

         File file = new File("千字文.txt");

         Object obj = loadFileContent(file);

         if (obj!=null){

             System.out.println(obj.toString());

         }

     }

     /**

      * 此方法 读到的是字符,所以不会读到半个字符的情况,不会出现乱码.

      * @param file

      * @return

      */

     public static Object readFile(File file) {

         StringBuilder buffer = new StringBuilder();

         try {

             if (!file.exists()) {

                 return null;

             }

             InputStream inputStream = new FileInputStream(file);

             BufferedInputStream bufferedInputStream = new BufferedInputStream(inputStream);

             BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(bufferedInputStream));

             while (bufferedReader.ready()) {

                 buffer.append((char) bufferedReader.read());

             }

             bufferedReader.close();

             bufferedInputStream.close();

             inputStream.close();

             return buffer.toString();

         } catch (FileNotFoundException e) {

             e.printStackTrace();

             return null;

         } catch (IOException e) {

             e.printStackTrace();

             return null;

         }

     }

     /**

      * byte字节流读取文件时 一个汉字占2个字节

      * 可能只能读到半个 时长度没有一次读完时 字符无法对齐

      * 出现乱码 可能会是以上原因

      * @param file

      * @return

      */

     public static Object loadFileContent(File file) {

         StringBuffer buffer = new StringBuffer();

         try {

             if (!file.exists()) {

                 return null;

             }

             InputStream inputStream = new FileInputStream(file);

             byte[] bytes = new byte[1024];

             int length;

             while ((length = inputStream.read(bytes)) != -1) {

                 buffer.append(new String(bytes, 0, length));

             }

             inputStream.close();

             return buffer.toString();

         } catch (FileNotFoundException e) {

             e.printStackTrace();

             return null;

         } catch (IOException e) {

             e.printStackTrace();

             return null;

         }

     }

 }

InputStream 读取中文乱码扩展的更多相关文章

File.ReadAllText 读取中文乱码问题
原文:File.ReadAllText 读取中文乱码问题用 File.ReadAllText(filepath) 去读取中文txt文件会遇到乱码问题,我自己测试了一下,ANSI编码的txt才会出 ...
关于java.util.Properties读取中文乱码的正确解决方案（不要再用native2ascii.exe了）
从Spring框架流行后,几乎根本不用自己写解析配置文件的代码了,但近日一个基础项目(实在是太基础,不能用硕大繁琐的Spring), 碰到了用java.util.Properties读取中文内容(UT ...
解决使用Properties读取中文乱码问题
web服务返回的是多行以key和value对应的键值对,且编码为utf-8.我的项目使用的编码也是utf-8,但是我用Properties读取中文的时候,打印出来的总是乱码. 后来网上查了一下,得到如 ...
Delphi NativeXml读取中文乱码问题解决
NativeXml默认的字符类型为Utf8String,有时在读取中文时还是会出现乱码问题,在329版本中提供一种类型转换函数sdUtf8ToWide(),我们可以这样sdUtf8ToWide(AXm ...
如何处理Cookie存储和读取中文乱码问题
存储Cookie for(String str:books){ str=new String(str.getBytes("ISO-8859-1"),"utf-8" ...
jmeter之http请求用csv读取中文乱码
jmeter3.2版本中CSV Data Set Config从本地读取静态文件的时候,遇到中文乱码的解决方式如下: CSV Data Set Config设置 http请求数据显示乱码把txt文档 ...
sqlite读取中文乱码(C#)
C#读取一些C++创建的sqlite数据库时乱码, C++保存DB是用GB2312编码的, C#调用的官方的system.data.sqlite是用的UTF-8编码的, 在读取时会乱码, 用一个GB ...
boost.property_tree读取中文乱码问题正确的解决方式
开发项目的时候在使用boost,在宽字符下遇到中文乱码问题上网上看大家都是先转成utf8在进行解析的,例如: http://blog.csdn.net/hu_jiangan/article/deta ...
java读取中文乱码解决方法
Java读取文本文件(例如csv文件.txt文件等),遇到中文就变成乱码.读取代码如下: List<String> lines=new ArrayList<String>(); ...

随机推荐

领扣（LeetCode）最大连续1的个数个人题解
给定一个二进制数组, 计算其中最大连续1的个数. 示例 1: 输入: [1,1,0,1,1,1] 输出: 3 解释: 开头的两位和最后的三位都是连续1,所以最大连续1的个数是 3. 注意: 输入的数组 ...
安装win7和ubuntu16.04双系统
硬件:2012年本子话硕A55V Service 准备: 首先通过一键还原备份win7系统!不清楚某些失误会不会备份也不能拯救! 清出100g硬盘空间,ubuntu会安装在这里查看当前win7启 ...
树的点分治（poj 1741， 1655（树形dp））
poj 1655:http://poj.org/problem?id=1655 题意: 给无根树, 找出以一节点为根, 使节点最多的树,节点最少. 题解:一道树形dp,先dfs 标记所有节点的子 ...
小程序api的promise封装
微信小程序和支付宝小程序的api封装方法是一样的,都是外部新建一个js,使用module.exports导出,要注意的是,最好使用post请求,虽然get请求没什么不好,主要是好修改.这里使用的MD5 ...
ArrayList实现原理（JDK1.8）
ArrayList实现原理(JDK1.8) public class ArrayList<E> extends AbstractList<E> implements List& ...
python接口设计中的__all__和del
最近在实现python接口中遇到了一些小问题,解决后总结如下. 目的:在设计接口时,只暴露某个文件的特定方法. 例如: t.py import os import sys def a(): pass ...
Spring Boot 注解之ObjectProvider源码追踪
最近依旧在学习阅读Spring Boot的源代码,在此过程中涉及到很多在日常项目中比较少见的功能特性,对此深入研究一下,也挺有意思,这也是阅读源码的魅力之一.这里写成文章,分享给大家. 自动配置中的O ...
Linux如何切换图形界面和命令行界面
在命令行,输入 init 3 命令,并按回车键执行,切换到命令行界面切换到命令行界面后,在界面上只显示一个闪烁的光标,按下 Ctrl+Alt+F6(非虚拟机)或者 Alt+F6(虚拟机),显示用户登 ...
Lambda入门，看这一篇幅就够了
jdk1.8中的lambda表达式学习笔记一.引入一个例子我们写一个多线程的例子,如下:采用实现Runable接口的方式 package cn.lyn4ever.lambda; public cl ...
CCNA 之三 TCP/IP 及子网划分
TCP/IP TCP/IP 协议集或协议簇概念: 传输控制协议/IRI特网协议(TCP/IP)组是由美国国防比(DoD)所创建的,主要用来确保数据的完整性及毁灭性战争中维持通信是有一组不同功能的协 ...

InputStream 读取中文乱码 扩展

InputStream 读取中文乱码 扩展的更多相关文章

随机推荐

热门专题

InputStream 读取中文乱码扩展

InputStream 读取中文乱码扩展的更多相关文章