Java NIO学习与记录(二):FileChannel与Buffer用法与说明

上一篇简单介绍了NIO,这一篇将介绍FileChannel结合Buffer的用法,主要介绍Buffer

一、FileChannel例子

上一篇说到,这个Channel属于文件通道,专门读取文件信息,NIO读取文件内容的简单的例子:

代码块1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
public static void readFile() {
RandomAccessFile file = null;
try {
file = new RandomAccessFile("D:\\rua.txt", "rw");
FileChannel fileChannel = file.getChannel(); //获取文件通道
ByteBuffer buf = ByteBuffer.allocate(2); //分配容积为2字节的一块Buffer,用来读取数据
int bytesRead = fileChannel.read(buf); //从通道里读取数据到Buffer内(最大不超过Buffer容积)
while (bytesRead != -1) { //当读不到任何东西时返回-1
buf.flip(); //切换到Buffer读模式,读模式下可以读取到之前写入Buffer的数据
while (buf.hasRemaining()) { //循环输出Buffer中的数据
System.out.print((char) buf.get());
}
buf.compact(); //或者调用clear,切换回Buffer的写模式
bytesRead = fileChannel.read(buf); //跟上面一样,再次从通道读取数据到Buffer中
}
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
if (file != null) {
file.close();
}
} catch (IOException e) {
e.printStackTrace();
}
}
}

rua.txt文件内容为:123456789 上述代码运行后输出如下:

1
123456789

文件正常读取,可以结合上面的注释,来分析下过程,接下来要利用上面的例子介绍Buffer的一些概念。

二、Buffer的概念

2.1:Buffer操作的步骤

第一篇说过,Buffer是一个缓冲区,是一个容器,负责从通道读取数据或者写数据给通道,通过上面的例子,我们可以看到Buffer在读取通道数据时的几个步骤:

step1:分配空间

代码块2
1
ByteBuffer.allocate(1024); //除此之外,还可以通过allocateDirector分配空间(具体不了解,先放一边,回头补)

step2:从通道读取数据,写入Buffer

代码块3
1
int bytesRead = fileChannel.read(buf);

step3:读取Buffer内的内容,切换回Buffer读模式

代码块4
1
buf.flip(); //切换到Buffer读模式,读模式下可以读取到之前写入Buffer的数据

step4:循环执行读写操作,每取完一次Buffer中的值,都切换回写模式,再次从通道读取数据到Buffer

代码块5
1
2
3
4
5
6
7
8
while (bytesRead != -1) { //当读不到任何东西时返回-1
buf.flip(); //切换到Buffer读模式,读模式下可以读取到之前写入Buffer的数据
while (buf.hasRemaining()) { //循环输出Buffer中的数据
System.out.print((char) buf.get());
}
buf.compact(); //或者调用clear,切换回Buffer的写模式
bytesRead = fileChannel.read(buf); //跟上面一样,再次从通道读取数据到Buffer中
}

2.2:Buffer读写流程详解

2.2.1:重要属性的介绍

Buffer具备的几个重要概念:

  • capacity:缓冲区数组的总长度(容积)
  • position:下一个需要操作的数据元素的位置
  • limit:缓冲区不可操作的下一个元素的位置,limit <= capacity
  • mark:用于记录position的前一个位置或默认是-1
2.2.2:Buffer内部的操作流程

结合上面的概念,除了mark(再往下介绍),其余几个指标的操作变化如下图:

初始化一个容积为10的Buffer,初识位置limit = capacityposition位于第一个位置

图1

当容器内写入了5个数据元素之后,position的位置变到了第6个位置,标记当前写入到哪里了

图2

这时候不再写入数据了,开始切换回Buffer的读模式(flip),发生的变化如下:

图3

发现,原先读模式下的position的位置被limit替换掉了,而position被重置为了第一个位置,这是因为现在读模式下想要读取之前写入的内容,为了保证读取的数据都是可读的(之前写入的),就需要有一个标记,来记录之前写模式下,操作到哪里了,position被重置为第一个位置,也很容易理解,因为切换了读模式,从头开始读取已写入的数据。

通过上面的描述,我们清楚了buffer是如何利用positionlimitcapacity来完成读写操作的,下面我们来介绍下具体读写操作时Bufer发生的操作:

Buffer切换读模式的方法有:flip

Buffer切换写模式的方法有:clear、compact

Buffer读数据:get


使用clear切换回写模式的时候,position会被置为0(也就是最初的位置),limit置为capacity(也就是最后的位置),意味着切换写模式之前未读的数据,将会被新一轮的写入覆盖,就再也找不回来了,所以除clear这个操作,Buffer还提供了compact方法来切换读模式,这个方法会把所有未读的数据拷贝到Buffer的起始位置,然后position指向最后一个未读数据的后一位,这样,下次开启读模式的时候,position操作同上,置为0,因此之前未读完被落下的数据也就在这时候被读到了。

下面我们来还原下这个转换过程:

图4

走到上面的步骤后,我们切换成写模式,下面这个图分别表示了clearcompact两个方法下的两种操作:

图5

根据图4图5,结合上面的话,更容易理解clearcompact两种方式切换写模式所做的内部操作,以及为什么clear会丢数据,而compact不会。

下面通过一开始的例子,把中间读取数据的地方稍微做下修改:

代码块6
1
2
3
4
5
6
7
8
9
10
ByteBuffer buf = ByteBuffer.allocate(2);
int bytesRead = readChannel.read(buf);
while (bytesRead != -1) {
buf.flip();
char result = (char) buf.get(); //虽然读进来了2个字节,但这里只取一个
System.out.print(result);
buf.clear(); // 使用clear切换回Buffer的写模式
bytesRead = readChannel.read(buf);
}
System.out.println("-----------程序结束");

输出结果:

1
13579-----------程序结束

发现丢了一些数据,现在把clear改成compact,运行结果为:

1
12345678-----------程序结束

发现,除了9,都输出来了(至于9为啥没输出,因为每次只取了一个字节的数据呀~)

那么,如果切换到读模式,但是不读,然后切换回写模式继续写,会发生什么?

改造上述代码如下:

代码块7
1
2
3
4
5
6
7
8
ByteBuffer buf = ByteBuffer.allocate(2);
int bytesRead = readChannel.read(buf);
while (bytesRead != -1) {
buf.flip();
buf.clear(); // 不读,立刻切回写模式
bytesRead = readChannel.read(buf);
}
System.out.println("-----------程序结束");

调用clear的情况下输出:

1
-----------程序结束

而调用compact方法,却发生阻塞(死循环)了,结合之前的图,我们可以知道,如果不读,意味着在compact下会把未读的数据copy到Buffer里,如果一点都不读,那么意味着被copy的这批数据会占满整个Buffer,以至于position没有下一个位置可用,就会发生文件里的数据没办法被安排进缓冲区(意味着文件读不完),bytesRead一直不等于-1,发生死循环。

通过上面的图和例子,基本上可以理清楚读模式写模式(包含不同的切换方式)下的Buffer内部处理方式。

2.3:Buffer的其他操作

除了上面几种常规用法,Buffer还提供了其他的几个操作方法

2.3.1:rewind

这个方法可以在读模式下,重置position的位置,也就是说在get执行后。position发生了位移,这个方法可以重置position的位置为初始位置,看例子:

代码块8
1
2
3
4
5
6
7
8
9
10
ByteBuffer buf = ByteBuffer.allocate(2); //每次可读入两个字节
int bytesRead = readChannel.read(buf);
while (bytesRead != -1) {
buf.flip();
System.out.print((char) buf.get());
buf.rewind(); //重置position
System.out.print((char) buf.get());//这时候读到的数据跟上面是同一个
buf.clear();
bytesRead = readChannel.read(buf);
}

运行结果:

1
1133557799

可以看到,每次循环拿到两个字节,但两次获取的数据都是同一个,因为rewind把读取游标重置成初始位置了(也即是位置0)

⭐️ 这里说下,如果把上面的第二个get方法去掉,然后把clear模式改成compact模式同样也会发生死循环,因为rewind重置了游标,重置后又没有get方法再次读取,导致把本次的两个字节又复制进了Buffer,跟之前说的不读一样,会导致Buffer没有多余的空间放文件里的数据,导致一直读不完,发生死循环。

2.3.2:mark & reset

这两个方法放到一起说,因为mark跟reset不放在一起使用,没有任何意义。

  • mark:用于标记当前position的位置
  • reset:用于恢复被mark标记的position的位置

例子:

代码块9
1
2
3
4
5
6
7
8
9
10
11
ByteBuffer buf = ByteBuffer.allocate(2);
int bytesRead = readChannel.read(buf);
while (bytesRead != -1) {
buf.flip();
buf.mark(); //标记当前位置,这里也就是初始位置
System.out.print((char) buf.get()); //读取到了初识位置数据
buf.reset(); //重置position到mark标记时那个值
System.out.print((char) buf.get()); //这里由于被reset了,因此输出的还是初识位置的数据
buf.clear();
bytesRead = readChannel.read(buf);
}

输出结果:

1
1133557799

会发现,上下两个打印都是是一样的数据。嘛,还是跟上面一样,再回顾一下,这里如果用compact会怎么操作?如果使用compact会打印如下语句:

1
1122334455667788

这个现在也很好理解了,因为重置了位置所以每个数据被打印了两次,由于mark的原因,每次实际上相当于只读了一个数据,所以剩下的一个数据被顺延到下次循环里打印,以此类推。

2.3.3:equals & compareTo
  • equals:用来比较两个Buffer是否相等,判等条件为
    1. 类型相同(byte、char等)
    2. 剩余元素个数相等
    3. 剩余元素相同
  • compareTo:比较两个Buffer中剩余元素的大小,如果满足如下条件,则认为buffer1小于buffer2:
    1. buffer1中第一个与buffer2不相等的元素小于buffer2的那个元素
    2. 所有元素相同,但是buffer1先比buffer2耗尽

三、实例:边读边写

例子:将rua.txt里的内容在读的同时写入文件haha.txt里

代码块10
1
2
3
4
5
6
7
8
9
10
11
12
13
readFile = new RandomAccessFile("D:\\rua.txt", "r");
writeFile = new RandomAccessFile("D:\\haha.txt", "rw");
FileChannel readChannel = readFile.getChannel(); //获取只读文件通道
FileChannel writeChannel = writeFile.getChannel(); //获取写文件通道

ByteBuffer readBuf = ByteBuffer.allocate(2); //分配容积为2字节的一块Buffer,用来读取数据
int bytesRead = readChannel.read(readBuf); //从通道里读取数据到Buffer内(最大不超过Buffer容积)
while (bytesRead != -1) { //当读不到任何东西时返回-1
readBuf.flip(); //切换到Buffer读模式,读模式下可以读取到之前写入Buffer的数据
writeChannel.write(readBuf); //将现在的buffer里的数据写到文件haha.txt里
readBuf.compact(); // 切换回Buffer的写模式
bytesRead = readChannel.read(readBuf); //跟上面一样,再次从通道读取数据到Buffer中
}

结果haha.txt里的内容为:123456789

四、Buffer的分类

类别 解释
ByteBuffer 支持存放字节类型数据,抽象类,有DirectByteBufferHeapByteBufferMappedByteBuffer两个子类,下面进行说明
CharBuffer 支持存放char类型数据
DoubleBuffer 支持存放double类型数据
FloatBuffer 支持存放float类型数据
IntBuffer 支持存放int类型数据
LongBuffer 支持存放long类型数据
ShortBuffer 支持存放short类型数据
表1

通过上表可以看到,Buffer有很多实现,其中大部分都对应一种基本类型,ByteBuffer比较特殊,下面介绍下它的两个子类。

ByteBuffer —-> HeapByteBuffer

直接通过byte数组实现的在java堆上的缓冲区。

ByteBuffer —-> DirectByteBuffer

直接在java堆外申请的一块内存,将文件映射到该内存空间,在大文件读写方面的效率非常高。

ByteBuffer —–> MappedByteBuffer

同样写效率非常高。

关于这几个Buffer后续会专门整理一篇文章来写。