InputStream 读取中文乱码扩展

对于InputStream读取中文乱码，下面这段话给出了很好的解释，以及后续编码上的扩展。

BufferedInputStream和BufferedOutputStream是过滤流，需要使用已存在的节点来构造。

即必须先有InputStream或OutputStream，相对直接读写，这两个流提供带缓存的读写，提高了系统读写效率性能。

BufferedInputStream读取的是字节byte，因为一个汉字占两个字节，而当中英文混合的时候，有的字符占一个字节，有的字符占两个字节。

所以如果直接读字节，而数据比较长，没有一次读完的时候，很可能刚好读到一个汉字的前一个字节，这样，这个中文就成了乱码，后面的数据因为没有字节对齐，也都成了乱码。

所以我们需要用BufferedReader来读取，它读到的是字符，所以不会读到半个字符的情况，不会出现乱码。

 package com.read;

 import java.io.*;

 /**

  *千字文.txt 在 classpath 用来测试

  */

 public class Main {

     public static void main(String[] args) {

         File file = new File("千字文.txt");

         Object obj = loadFileContent(file);

         if (obj!=null){

             System.out.println(obj.toString());

         }

     }

     /**

      * 此方法 读到的是字符,所以不会读到半个字符的情况,不会出现乱码.

      * @param file

      * @return

      */

     public static Object readFile(File file) {

         StringBuilder buffer = new StringBuilder();

         try {

             if (!file.exists()) {

                 return null;

             }

             InputStream inputStream = new FileInputStream(file);

             BufferedInputStream bufferedInputStream = new BufferedInputStream(inputStream);

             BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(bufferedInputStream));

             while (bufferedReader.ready()) {

                 buffer.append((char) bufferedReader.read());

             }

             bufferedReader.close();

             bufferedInputStream.close();

             inputStream.close();

             return buffer.toString();

         } catch (FileNotFoundException e) {

             e.printStackTrace();

             return null;

         } catch (IOException e) {

             e.printStackTrace();

             return null;

         }

     }

     /**

      * byte字节流读取文件时 一个汉字占2个字节

      * 可能只能读到半个 时长度没有一次读完时 字符无法对齐

      * 出现乱码 可能会是以上原因

      * @param file

      * @return

      */

     public static Object loadFileContent(File file) {

         StringBuffer buffer = new StringBuffer();

         try {

             if (!file.exists()) {

                 return null;

             }

             InputStream inputStream = new FileInputStream(file);

             byte[] bytes = new byte[1024];

             int length;

             while ((length = inputStream.read(bytes)) != -1) {

                 buffer.append(new String(bytes, 0, length));

             }

             inputStream.close();

             return buffer.toString();

         } catch (FileNotFoundException e) {

             e.printStackTrace();

             return null;

         } catch (IOException e) {

             e.printStackTrace();

             return null;

         }

     }

 }

InputStream 读取中文乱码扩展的更多相关文章

File.ReadAllText 读取中文乱码问题
原文:File.ReadAllText 读取中文乱码问题用 File.ReadAllText(filepath) 去读取中文txt文件会遇到乱码问题,我自己测试了一下,ANSI编码的txt才会出 ...
关于java.util.Properties读取中文乱码的正确解决方案（不要再用native2ascii.exe了）
从Spring框架流行后,几乎根本不用自己写解析配置文件的代码了,但近日一个基础项目(实在是太基础,不能用硕大繁琐的Spring), 碰到了用java.util.Properties读取中文内容(UT ...
解决使用Properties读取中文乱码问题
web服务返回的是多行以key和value对应的键值对,且编码为utf-8.我的项目使用的编码也是utf-8,但是我用Properties读取中文的时候,打印出来的总是乱码. 后来网上查了一下,得到如 ...
Delphi NativeXml读取中文乱码问题解决
NativeXml默认的字符类型为Utf8String,有时在读取中文时还是会出现乱码问题,在329版本中提供一种类型转换函数sdUtf8ToWide(),我们可以这样sdUtf8ToWide(AXm ...
如何处理Cookie存储和读取中文乱码问题
存储Cookie for(String str:books){ str=new String(str.getBytes("ISO-8859-1"),"utf-8" ...
jmeter之http请求用csv读取中文乱码
jmeter3.2版本中CSV Data Set Config从本地读取静态文件的时候,遇到中文乱码的解决方式如下: CSV Data Set Config设置 http请求数据显示乱码把txt文档 ...
sqlite读取中文乱码(C#)
C#读取一些C++创建的sqlite数据库时乱码, C++保存DB是用GB2312编码的, C#调用的官方的system.data.sqlite是用的UTF-8编码的, 在读取时会乱码, 用一个GB ...
boost.property_tree读取中文乱码问题正确的解决方式
开发项目的时候在使用boost,在宽字符下遇到中文乱码问题上网上看大家都是先转成utf8在进行解析的,例如: http://blog.csdn.net/hu_jiangan/article/deta ...
java读取中文乱码解决方法
Java读取文本文件(例如csv文件.txt文件等),遇到中文就变成乱码.读取代码如下: List<String> lines=new ArrayList<String>(); ...

随机推荐

PHP 在Swoole中使用双IoC容器实现无污染的依赖注入
简介: 容器(container)技术(可以理解为全局的工厂方法), 已经是现代项目的标配. 基于容器, 可以进一步实现控制反转, 依赖注入. Laravel 的巨大成功就是构建在它非常强大的IoC容 ...
JS如何在不给新空间的情况下给数组去重？
1.先排序,在让相邻元素对比去重 const nums = [3, 1, 1, 5, 2, 3, 4, 3, 5, 5, 6, 4, 6, 6, 6]; Array.prototype.arrayNo ...
node.js传参给PHP失败，headers加上'Content-Length': Buffer.byteLength(content)
node.js需要传参给PHP,执行计划任务 var events = require('events'); start_cron(,,{"auth":"7wElqW6v ...
React-Hook
import React, { useState } from 'react'; // Hook 写法 function App2 () { const [count,setCount] = useS ...
微信小程序使用 ECharts 实现数据可视化
微信小程序使用 ECharts 显示图表首先创建微信小程序这里就不再赘述下载 GitHub 上的 ecomfe/echarts-for-weixin 下载后解压,打开文件夹,里面的 ec-can ...
2019-11-28:ssrf基础学习，笔记
ssrf服务端请求伪造ssrf是一种由恶意访问者构造形成由服务端发起请求的一个安全漏洞,一般情况下,ssrf访问的目标是从外网无法访问的内部系统,正式因为它是由服务端发起的,所以它能请求到它相连而外网 ...
新闻实时分析系统Hive与HBase集成进行数据分析
(一)Hive 概述 (二)Hive在Hadoop生态圈中的位置 (三)Hive 架构设计 (四)Hive 的优点及应用场景 (五)Hive 的下载和安装部署 1.Hive 下载 Apache版本的H ...
.NET高级特性-Emit(2.1)字段
在上篇blog写完的几天后,有读者反映写的过于复杂,导致无法有效的进行实践:博主在考虑到园子里程序员水平高低不一致的情况,所以打算放慢脚步,对类的一些内容进行详细的讲解,顺带的会写一些笔者所遇到过的E ...
kipmio占用cpu资源过高
虽然这是一个利用空余的CPU资源进行一些接口自动调节的任务,但看着占那么多的资源还是怕出意外. 可以临时降低 echo 100 > /sys/module/ipmi_si/parameters/ ...
C语言基础 -- 变量
常用变量类型地址小端低地址保存低位,高地址保存高位常用于 PC(复杂指令集) 大端低地址保存高位,高地址保存低位常用于 ARM/手机/网络(精简指令集)

InputStream 读取中文乱码 扩展

InputStream 读取中文乱码 扩展的更多相关文章

随机推荐

热门专题

InputStream 读取中文乱码扩展

InputStream 读取中文乱码扩展的更多相关文章