面试系列——javaIO

一、概述

java的IO主要分为以下几类：

磁盘操作：File
字节操作：InputStream 和 OutputStream
字符操作：Reader 和 Writer
对象操作：Serializable
网络操作：Socket
新的输入/输出：NIO

二、磁盘操作

File类可以用于表示文件和目录的信息，但是它不代表文件的内容。

递归地列出一个目录下所有文件：

public static void listAllFiles(File dir) {

    if (dir == null || !dir.exists()) {

        return;

    }

    if (dir.isFile()) {

        System.out.println(dir.getName());

        return;

    }

    for (File file : dir.listFiles()) {

        listAllFiles(file);

    }

}

从java7开始，可以使用Paths和Files代替File。

三、字节操作

实现文件复制

public static void copyFile(String src, String dist) throws IOException {

    FileInputStream in = new FileInputStream(src);

    FileOutputStream out = new FileOutputStream(dist);

    byte[] buffer = new byte[20 * 1024];

    int cnt;

    // read() 最多读取 buffer.length 个字节

    // 返回的是实际读取的个数

    // 返回 -1 的时候表示读到 eof，即文件尾

    while ((cnt = in.read(buffer, 0, buffer.length)) != -1) {

        out.write(buffer, 0, cnt);

    }

    in.close();

    out.close();

}

装饰者模式

javaIO使用了装饰者模式来实现。以InpuStream为例：

InputStream 是抽象组件；
FileInputStream 是 InputStream 的子类，属于具体组件，提供了字节流的输入操作；
FilterInputStream 属于抽象装饰者，装饰者用于装饰组件，为组件提供额外的功能。例如 BufferedInputStream 为 FileInputStream 提供缓存的功能。

实例化一个具有缓存功能的字节流对象时，只需要在 FileInputStream 对象上再套一层 BufferedInputStream 对象即可。

FileInputStream fileInputStream = new FileInputStream(filePath);

BufferedInputStream bufferedInputStream = new BufferedInputStream(fileInputStream);

DataInputStream 装饰者提供了对更多数据类型进行输入的操作，比如 int、double 等基本类型。

四、字符操作

编码与解码

编码就是把字符转为字节，而解码就是把字节重新组合成字符。

如果编码和解码过程使用不同的编码方式那么就出现了乱码。

GBK 编码中，中文字符占 2 个字节，英文字符占 1 个字节；
UTF-8 编码中，中文字符占 3 个字节，英文字符占 1 个字节；
UTF-16be 编码中，中文字符和英文字符都占 2 个字节。

UTF-16be 中的 be 指的是 Big Endian，也就是大端。相应地也有 UTF-16le，le 指的是 Little Endian，也就是小端。

Java 的内存编码使用双字节编码 UTF-16be，这不是指 Java 只支持这一种编码方式，而是说 char 这种类型使用 UTF-16be 进行编码。char 类型占 16 位，也就是两个字节，Java 使用这种双字节编码是为了让一个中文或者一个英文都能使用一个 char 来存储。

String str1 = "中文";

byte[] bytes = str1.getBytes("UTF-8");

String str2 = new String(bytes, "UTF-8");

System.out.println(str2);

在调用无参数 getBytes() 方法时，默认的编码方式不是 UTF-16be。双字节编码的好处是可以使用一个 char 存储中文和英文，而将 String 转为 bytes[] 字节数组就不再需要这个好处，因此也就不再需要双字节编码。getBytes() 的默认编码方式与平台有关，一般为 UTF-8。

byte[] bytes = str1.getBytes();

Reader 与 Writer

不管是磁盘还是网络传输，最小的存储单元都是字节，而不是字符。但是在程序中操作的通常是字符形式的数据，因此需要提供对字符进行操作的方法。

InputStreamReader 实现从字节流解码成字符流；
OutputStreamWriter 实现字符流编码成为字节流。

实现逐行输出文本文件的内容

public static void readFileContent(String filePath) throws IOException {

    FileReader fileReader = new FileReader(filePath);

    BufferedReader bufferedReader = new BufferedReader(fileReader);

    String line;

    while ((line = bufferedReader.readLine()) != null) {

        System.out.println(line);

    }

    // 装饰者模式使得 BufferedReader 组合了一个 Reader 对象

    // 在调用 BufferedReader 的 close() 方法时会去调用 Reader 的 close() 方法

    // 因此只要一个 close() 调用即可

    bufferedReader.close();

}

五、对象操作

序列化

序列化就是将一个对象转换成字节序列，方便存储和传输。

序列化：ObjectOutputStream.writeObject()
反序列化：ObjectInputStream.readObject()

不会对静态变量进行序列化，因为序列化只是保存对象的状态，静态变量属于类的状态。

Serializable

序列化的类需要实现 Serializable 接口，它只是一个标准，没有任何方法需要实现，但是如果不去实现它的话而进行序列化，会抛出异常。

public static void main(String[] args) throws IOException, ClassNotFoundException {

    A a1 = new A(123, "abc");

    String objectFile = "file/a1";

    ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream(objectFile));

    objectOutputStream.writeObject(a1);

    objectOutputStream.close();

    ObjectInputStream objectInputStream = new ObjectInputStream(new FileInputStream(objectFile));

    A a2 = (A) objectInputStream.readObject();

    objectInputStream.close();

    System.out.println(a2);

}

private static class A implements Serializable {

    private int x;

    private String y;

    A(int x, String y) {

        this.x = x;

        this.y = y;

    }

    @Override

    public String toString() {

        return "x = " + x + "  " + "y = " + y;

    }

}

transient

transient 关键字可以使一些属性不会被序列化。

ArrayList 中存储数据的数组 elementData 是用 transient 修饰的，因为这个数组是动态扩展的，并不是所有的空间都被使用，因此就不需要所有的内容都被序列化。通过重写序列化和反序列化方法，使得可以只序列化数组中有内容的那部分数据。

private transient Object[] elementData;

六、网络操作

java中的网络支持：

InetAddress:用于表示网络上的硬件资源，即IP地址
URL：统一资源定位符
Socke：使用TCP协议实现网络通信
Datagram：使用UDP协议实现网络通信

InetAddress

没有公有的构造函数，只能通过静态方法来创建实例。

InetAddress.getByName(String host);

InetAddress.getByAddress(byte[] address);

URL

可以直接从URL中读取字节流数据。

public static void main(String[] args) throws IOException {

    URL url = new URL("http://www.baidu.com");

    /* 字节流 */

    InputStream is = url.openStream();

    /* 字符流 */

    InputStreamReader isr = new InputStreamReader(is, "utf-8");

    /* 提供缓存功能 */

    BufferedReader br = new BufferedReader(isr);

    String line;

    while ((line = br.readLine()) != null) {

        System.out.println(line);

    }

    br.close();

}

Sockets

ServerSocket:服务端类
Socket：客户端类
服务器和客户端通过InputStream和OutputStream进行输入输出

Datagram

DatagramSocket：通信类
DatagramPacket：数据包类

七、NIO

新的输入/输出（NIO）库时在jdk1.4中引入的，弥补了原来的IO的不足，提供了高速的、面向块的IO。

流与块

IO与NIO最重要的区别是数据打包和传输的方式，IO以流的方式处理数据，而NIO以块的方式处理数据。

面向流的IO一次处理一个字节数据：一个输入流产生一个字节数据，一个输出流消费一个字节数据。为流式数据创建过滤器非常容易，链接几个过滤器，以便每个过滤器只负责复杂处理机制的一部分。不利的一面是，面向流的IO通常相当慢。

面向块的IO一次处理一个数据块，按块处理数据比按流处理数据要快得多。但是面向块的IO缺少一些面向流的IO所具有的优雅性和简单性。

通道与缓冲区

1、通道

通道Channel是对原IO包中的流的模拟，可以通过它读取和写入数据。

通道与流的不同之处在于，流只能在一个方向上流动感（一个流必须是inputStream或者OutputStream的子类）而通道是双向的，可以用于读、写或者同时用于读写。

通道包含以下类型：

FileChannel：从文件中读取数据
DatagramChannel：通过UDP读写网络中数据
SocketChannel：通过TCP读写网络中数据
ServerSocketChannel：可以监听新进来的TCP连接，对每一个新进来的连接都会创建一个SocketChannel

2. 缓冲区

发送给一个通道的所有数据都必须首先放到缓冲区中，同样地，从通道中读取的任何数据都要先读到缓冲区中。也就是说，不会直接对通道进行读写数据，而是要先经过缓冲区。

缓冲区实质上是一个数组，但它不仅仅是一个数组。缓冲区提供了对数据的结构化访问，而且还可以跟踪系统的读/写进程。

缓冲区包括以下类型：

ByteBuffer
CharBuffer
ShortBuffer
IntBuffer
LongBuffer
FloatBuffer
DoubleBuffer

3、选择器

NIO常常被叫做非阻塞IO，主要是因为NIO在网络通信中的非阻塞特性被广泛使用。NIO实现了IO多路复用的Reactor模型，一个线程Thread使用一个选择器Selector通过轮询的方式去监听多个通道Channel的事件，从而让一个线程就可以处理多个事件。（而IO在网络通信中，每当有一个socket连上，就开启一个线程，线程的创建和销毁是需要开销的，因此NIO的多路复用能够减少开销）因此使用一个线程来处理多个事件而不是一个线程处理一个事件，对于 IO 密集型的应用具有很好地性能。

对比

NIO与普通IO的区别主要有以下两点：

NIO是非阻塞的
NIO面向块，IO面向流

java面试系列<4>——IO的更多相关文章

Java面试系列
如果你的面试简历是如下这样写的,请务必准备回答下面的所有问题. 面试职位:Java高级工程师专业技能: (1)牢固掌握Java基础知识,如集合.并发.I/O等,并对Java源码有一定的研究. (2) ...
Java基础系列8——IO流超详细总结
该系列博文会告诉你如何从入门到进阶,一步步地学习Java基础知识,并上手进行实战,接着了解每个Java知识点背后的实现原理,更完整地了解整个Java技术体系,形成自己的知识框架. 在初学Java时,I ...
Java面试系列之HashMap大扫盲汇总
PS:整理的稍微有点急,不足之处,望各路道友指正,List相关可以查看前一篇随笔! HashMap的工作原理是近年来常见的Java面试题,几乎每个Java程序员都知道HashMap,都知道哪里要用Ha ...
Java面试系列--java基础
Java基础总结 JAVA中的几种基本数据类型是什么,各自占用多少字节. 八大基本数据类型,byte:8位,short:16位,int:32位,long:64位,float:32位,double:64 ...
Java面试准备之IO
Java IO Java IO 分类 Java BIO: 同步并阻塞,服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线 ...
Java面试系列第一篇-基本类型与引用类型
这篇文章总结一下我认为面试中最应该掌握的关于基本类型和引用类型的面试题目. 面试题目1:值传递与引用传递对于没有接触过C++这类有引用传递的Java程序员来说,很容易误将引用类型的参数传递理解为引用 ...
Java面试系列第2篇-Object类中的方法
Java的Object是所有引用类型的父类,定义的方法按照用途可以分为以下几种: (1)构造函数 (2)hashCode() 和 equals() 函数用来判断对象是否相同 (3)wait().wai ...
Java面试系列第3篇-HashMap相关面试题
HashMap是非线程安全的,如果想要用线程安全的map,可使用同步的HashTable或通过Collections.synchronizeMap(hashMap)让HashMap变的同步,或者使用并 ...
死磕Java面试系列：深拷贝与浅拷贝的实现原理
深拷贝与浅拷贝的问题,也是面试中的常客.虽然大家都知道两者表现形式不同点在哪里,但是很少去深究其底层原理,也不知道怎么才能优雅的实现一个深拷贝.其实工作中也常常需要实现深拷贝,今天一灯就带大家一块深入 ...

随机推荐

从Java的堆栈到Equals和==的比较
以下为链接 https://www.2cto.com/kf/201503/383832.html 栈与堆都是Java用来在Ram中存放数据的地方.与C++不同,Java自动管理栈和堆,程序员不能直接地 ...
【python3.x】发送自动化测试报告邮件
SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式.python的smtplib提供了 ...
Google单元测试框架gtest--值参数测试
测试一个方法,需要较多个参数进行测试,比如最大值.最小值.异常值和正常值.这中间会有较多重复代码工作,而值参数测试就是避免这种重复性工作,并且不会损失测试的便利性和准确性. 如果测试一个函数,需要些各 ...
Python函数注解
目录函数注解概述实际应用 inspect模块业务代码总结以下内容基于Python 3x 涉及的知识前提: 建议理解Python装饰器后学习此内容函数注解概述函数注解可以针对函数的参数.返 ...
MySQL：多表查询
SELECT查询不但可以从一张表查询数据,还可以从多张表同时查询数据.查询多张表的语法是:SELECT * FROM <表1> <表2>,普通多表查询会获取M x N行记录,所 ...
Python爬虫学习笔记(四)
Request: Test1(基本属性:POST): 代码1: import requests # 发送POST请求 data = { } response = requests.post(url, ...
心脏滴血(CVE-2014-0160)检测与防御
用Nmap检测 nmap -sV --script=ssl-heartbleed [your ip] -p 443 有心脏滴血漏洞的报告: ➜ ~ nmap -sV --script=ssl-hear ...
linux 设置DNS解决，不能ping 域名的问题
vi /etc/resolv.conf nameserver 114.114.114.114
JavaScript快速上手
引入JavaScript项目在html中 <!DOCTYPE html> <html lang="en"> <head> <meta c ...
FreeBSD ports 多线程编译
FreeBSD ports 多线程编译FORCE_MAKE_JOBS=yesMAKE_JOBS_NUMBER=4写入/etc/make.conf没有就新建.4是处理器核心数,不知道就别改.

java面试系列<4>——IO