Linux文件系统Ext2,Ext3,Ext4性能大比拼
Linux kernel 自 2.6.28 开始正式支持新的文件系统 Ext4。 Ext4 是 Ext3 的改进版,修改了 Ext3 中部分重要的数据结构,而不仅仅像 Ext3 对 Ext2 那样,只是增加了一个日志功能而已。Ext4 可以提供更佳的性能和可靠性,还有更为丰富的功能:
1. 与 Ext3 兼容。执行若干条命令,就能从 Ext3 在线迁移到 Ext4,而无须重新格式化磁盘或重新安装系统。原有 Ext3 数据结构照样保留,Ext4 作用于新数据,当然,整个文件系统因此也就获得了 Ext4 所支持的更大容量。
2. 更大的文件系统和更大的文件。较之 Ext3 目前所支持的最大 16TB 文件系统和最大 2TB 文件,Ext4 分别支持 1EB(1,048,576TB, 1EB=1024PB, 1PB=1024TB)的文件系统,以及 16TB 的文件。
3. 无限数量的子目录。Ext3 目前只支持 32,000 个子目录,而 Ext4 支持无限数量的子目录。
4. Extents。Ext3 采用间接块映射,当操作大文件时,效率极其低下。比如一个 100MB 大小的文件,在 Ext3 中要建立 25,600 个数据块(每个数据块大小为 4KB)的映射表。而 Ext4 引入了现代文件系统中流行的 extents 概念,每个 extent 为一组连续的数据块,上述文件则表示为“该文件数据保存在接下来的 25,600 个数据块中”,提高了不少效率。
5. 多块分配。当写入数据到 Ext3 文件系统中时,Ext3 的数据块分配器每次只能分配一个 4KB 的块,写一个 100MB 文件就要调用 25,600 次数据块分配器,而 Ext4 的多块分配器“multiblock allocator”(mballoc) 支持一次调用分配多个数据块。
6. 延迟分配。Ext3 的数据块分配策略是尽快分配,而 Ext4 和其它现代文件操作系统的策略是尽可能地延迟分配,直到文件在 cache 中写完才开始分配数据块并写入磁盘,这样就能优化整个文件的数据块分配,与前两种特性搭配起来可以显著提升性能。
7. 快速 fsck。以前执行 fsck 第一步就会很慢,因为它要检查所有的 inode,现在 Ext4 给每个组的 inode 表中都添加了一份未使用 inode 的列表,今后 fsck Ext4 文件系统就可以跳过它们而只去检查那些在用的 inode 了。
8. 日志校验。日志是最常用的部分,也极易导致磁盘硬件故障,而从损坏的日志中恢复数据会导致更多的数据损坏。Ext4 的日志校验功能可以很方便地判断日志数据是否损坏,而且它将 Ext3 的两阶段日志机制合并成一个阶段,在增加安全性的同时提高了性能。
9. “无日志”(No Journaling)模式。日志总归有一些开销,Ext4 允许关闭日志,以便某些有特殊需求的用户可以借此提升性能。
10. 在线碎片整理。尽管延迟分配、多块分配和 extents 能有效减少文件系统碎片,但碎片还是不可避免会产生。Ext4 支持在线碎片整理,并将提供 e4defrag 工具进行个别文件或整个文件系统的碎片整理。
11. inode 相关特性。Ext4 支持更大的 inode,较之 Ext3 默认的 inode 大小 128 字节,Ext4 为了在 inode 中容纳更多的扩展属性(如纳秒时间戳或 inode 版本),默认 inode 大小为 256 字节。Ext4 还支持快速扩展属性(fast extended attributes)和 inode 保留(inodes reservation)。
12. 持久预分配(Persistent preallocation)。P2P 软件为了保证下载文件有足够的空间存放,常常会预先创建一个与所下载文件大小相同的空文件,以免未来的数小时或数天之内磁盘空间不足导致下载失败。 Ext4 在文件系统层面实现了持久预分配并提供相应的 API(libc 中的 posix_fallocate()),比应用软件自己实现更有效率。
13. 默认启用 barrier。磁盘上配有内部缓存,以便重新调整批量数据的写操作顺序,优化写入性能,因此文件系统必须在日志数据写入磁盘之后才能写 commit 记录,若 commit 记录写入在先,而日志有可能损坏,那么就会影响数据完整性。Ext4 默认启用 barrier,只有当 barrier 之前的数据全部写入磁盘,才能写 barrier 之后的数据。(可通过 "mount -o barrier=0" 命令禁用该特性。)
Ext4 随 Linux kernel 2.6.28 正式发布已有数周,一直苦于找不到测试用的磁盘,正巧年前 Intel 送来几块 SSD 测试样品,这两天就顺带把 SSD 也测了。测试所使用的 Linux 内核版本为 2.6.28.2,测试工具为 IOzone 3.318。
IOzone 测试命令为:
time /opt/iozone/bin/iozone -a -s 4G -q 256 -y 4 >|/root/ext4-iozone-stdout.txt
上述命令的说明如下:
Auto Mode
File size set to 4194304 KB
Using Maximum Record Size 256 KB
Using Minimum Record Size 4 KB
Command line used: /opt/iozone/bin/iozone -a -s 4G -q 256 -y 4
Output is in Kbytes/sec
Time Resolution = 0.000001 seconds.
Processor cache size set to 1024 Kbytes.
Processor cache line size set to 32 bytes.
File stride size set to 17 * record size.
测试结果除了表明 Intel SSD 的读写速度快得令人咋舌之外,还可以说明 Ext4 的各方面性能都超过了上一代 Ext3,甚至在大多数情况下,比没有日志功能的 Ext2 还要快出不少:
| reclen | write | rewrite | read | reread | random read | random write | |
| Ext2 | 218,680 | 216,596 | 630,248 | 245,802 | 88,700 | 138,065 | |
| 215,308 | 218,690 | 556,064 | 246,260 | 154,680 | 150,052 | ||
| real 28m12.718s | 216,457 | 216,843 | 575,046 | 245,701 | 258,660 | 158,750 | |
| user 0m10.725s | 217,925 | 214,289 | 537,976 | 243,081 | 394,013 | 167,002 | |
| sys 5m8.265s | 215,460 | 219,256 | 527,919 | 244,362 | 503,227 | 162,917 | |
| 219,081 | 216,173 | 540,831 | 242,526 | 609,750 | 161,442 | ||
| 216,091 | 217,631 | 565,111 | 245,157 | 654,274 | 173,955 | ||
| Ext3 | 218,242 | 213,039 | 482,132 | 243,986 | 88,007 | 156,926 | |
| 218,390 | 217,915 | 544,892 | 244,979 | 152,424 | 190,454 | ||
| real 27m42.449s | 218,083 | 217,683 | 561,038 | 244,506 | 255,244 | 200,032 | |
| user 0m11.529s | 216,258 | 217,013 | 569,246 | 243,811 | 389,745 | 198,275 | |
| sys 7m17.049s | 218,850 | 217,711 | 577,529 | 243,725 | 497,689 | 201,693 | |
| 220,234 | 215,687 | 530,519 | 241,615 | 608,244 | 199,619 | ||
| 216,011 | 220,188 | 592,578 | 242,548 | 642,341 | 199,408 | ||
| Ext4 | 221,823 | 216,992 | 532,488 | 273,668 | 85,210 | 183,195 | |
| 226,028 | 218,580 | 561,960 | 272,036 | 154,972 | 216,505 | ||
| real 27m3.485s | 222,241 | 217,746 | 547,548 | 270,895 | 260,899 | 223,895 | |
| user 0m10.847s | 220,121 | 213,025 | 240,426 | 247,628 | 345,210 | 175,977 | |
| sys 6m9.578s | 223,983 | 214,437 | 308,696 | 551,577 | 754,941 | 225,897 | |
| 222,576 | 217,816 | 624,636 | 271,293 | 644,500 | 224,997 | ||
| 221,202 | 222,238 | 541,685 | 270,898 | 671,748 | 228,085 | ||
| bkwd read | record rewrite | stride read | fwrite | frewrite | fread | freread | |
| Ext2 | 106,112 | 1,882,623 | 73,538 | 214,175 | 218,364 | 566,570 | 247,381 |
| 188,397 | 2,462,367 | 130,896 | 217,157 | 216,647 | 583,808 | 248,397 | |
| real 28m12.718s | 306,842 | 2,654,320 | 220,939 | 216,061 | 218,140 | 598,174 | 246,581 |
| user 0m10.725s | 464,240 | 2,397,831 | 340,775 | 217,434 | 219,353 | 583,463 | 246,341 |
| sys 5m8.265s | 609,546 | 2,546,079 | 456,243 | 216,875 | 217,692 | 571,707 | 244,264 |
| 721,701 | 2,656,729 | 551,122 | 217,780 | 217,427 | 579,271 | 242,291 | |
| 870,547 | 2,574,261 | 634,835 | 216,638 | 219,693 | 563,735 | 247,101 | |
| Ext3 | 105,557 | 1,540,739 | 75,010 | 216,028 | 216,432 | 522,704 | 243,385 |
| 181,486 | 1,945,603 | 130,737 | 218,364 | 216,431 | 530,853 | 243,222 | |
| real 27m42.449s | 300,212 | 2,096,495 | 221,329 | 216,930 | 216,661 | 514,177 | 244,069 |
| user 0m11.529s | 446,462 | 1,934,853 | 338,785 | 216,809 | 219,296 | 530,634 | 243,446 |
| sys 7m17.049s | 589,535 | 2,036,412 | 450,449 | 219,387 | 214,900 | 514,353 | 244,809 |
| 714,295 | 1,992,168 | 553,022 | 217,828 | 218,454 | 513,596 | 241,510 | |
| 834,240 | 2,092,959 | 624,043 | 217,682 | 218,165 | 529,358 | 242,878 | |
| Ext4 | 103,036 | 1,862,817 | 74,781 | 225,841 | 220,620 | 523,799 | 272,848 |
| 178,482 | 2,135,372 | 132,506 | 227,423 | 215,766 | 641,021 | 271,328 | |
| real 27m3.485s | 295,288 | 2,095,966 | 223,135 | 226,055 | 216,210 | 621,287 | 273,475 |
| user 0m10.847s | 451,631 | 2,145,351 | 342,236 | 225,796 | 213,427 | 598,331 | 269,759 |
| sys 6m9.578s | 523,130 | 2,218,016 | 448,086 | 227,030 | 214,706 | 582,795 | 272,323 |
| 720,468 | 2,308,315 | 582,943 | 225,971 | 217,373 | 552,335 | 274,237 | |
| 845,494 | 2,215,381 | 643,715 | 225,411 | 219,166 | 580,066 | 273,342 |
注:
1. 关于 IOzone 测试方法,参考 Ben Martin 的文章:IOzone for filesystem performance benchmarking
2. 关于 Ext4 的相关内容,参考 Kernel Newbies 专页: http://kernelnewbies.org/Ext4
原文http://www.weste.net/2009/2-2/19320553262.html
Linux文件系统Ext2,Ext3,Ext4性能大比拼的更多相关文章
- 漫谈Linux标准的文件系统(Ext2/Ext3/Ext4)
Ext 全称Linux extended file system, extfs,即Linux扩展文件系统,Ext2就代表第二代文件扩展系统,Ext3/Ext4以此类推,它们都是Ext2的升级版,只不过 ...
- linux分区之ext2,ext3,ext4,gpt
linux分区之ext2,ext3,ext4,gpt 2013-07-10 12:00:24 标签:ext3 gpt 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明 ...
- 使用 parted 命令可以查看系统采用什么类型的分区表 gpt/mbr/msdos/ext/ext/ext2/ext3/ext4
Linux磁盘表示方式 Linux以字母标识磁盘的个数 a:第一块 b:第二块 Linux用数字标识分区:1-4标识主分区或扩展分区 逻辑分区从5开始 例如:sda.sda1.sda2 低级格式化 ...
- 【转载】格式化存储装置成为 Ext2/Ext3/Ext4 档案系统
格式化 用系统管理员帐户 (即 root) 身份打「mkfs -t ext2|ext3|ext4 储存装置」: mkfs -t ext3 /dev/sdb5 要格式化档案系统为 Ext2,亦可以直接使 ...
- dumpe2fs 命令的使用,转储 ext2/ext3/ext4 文件系统信息
使用man 命令可以查看 dumpe2fs 命令具体的使用的方法: NAME dumpe2fs - dump ext2/ext3/ext4 filesystem information SYNOPSI ...
- linux 文件系统 xfs、ext4、ext3 的区别
前言 centos7.0开始默认文件系统是xfs,centos6是ext4,centos5是ext3 ext3介绍 ext3和ext4的最大区别在于,ext3在fsck时需要耗费大量时间(文件越多,时 ...
- ext2,ext3,ext4文件系统管理软件包e2fsprogs
e2fsprogs(也叫做e2fs programs)是一个Ext2(及Ext3/4)文件系统工具集(Ext2 Filesystems Utilities[2] ),它包含了诸如创建.修复.配置.调试 ...
- 调整分区大小(ext2\ext3\ext4)
现在的时间是2017年5月27日 我想说调整分区大小没那么麻烦,至少我直接将一个ext3格式分区从50G减少到了30G. 步骤如下 1 首先确保那个分区是没被挂载的. 2 调整分区大小,但是其实并没有 ...
- 在不损坏数据的情况下调整分区大小(ext2\ext3\ext4)
现在的时间是2017年5月27日 我想说调整分区大小没那么麻烦,至少我直接将一个ext3格式分区从50G减少到了30G. 步骤如下 1 首先确保那个分区是未挂载的. 2 调整分区大小,但是其实并没有实 ...
随机推荐
- editplus查找替换的正则表达式应用
表达式 说明\t 制表符.\n 新行.. 匹配任意字符.| 匹配表达式左边和右边的字符. 例如, "ab|bc" ...
- Java单例类的简单实现
对于java新手来说,单例类给我的印象挺深,之前一道web后台笔试题就是写单例类.*.*可惜当时不了解. 在大部分时候,我们将类的构造器定义成public访问权限,允许任何类自由创建该类的对象.但在某 ...
- 使用Jmeter测试MySQL性能——(2)多客户端配置
在测试性能过程中,单个测试客户端可能存在性能瓶颈无法达到测试要求的压力.在这种情况下,可以设置jmeter的多客户端模式,然后通过一台控制端,同时控制多台PC上的客户端向服务器发送测试请求.若有4台P ...
- iOS学习笔记---oc语言第九天
初级内存管理 iOS应用程序出现crash(闪退),90%以上是内存问题////其他:数组越界,方法只声明没实现 内存问题体现在两个方面:内存溢出\野指针异常 内存溢出:程序运行超出内存上限 野指针异 ...
- 关于时间的util类,以后方便查阅
public static int lastDayOfMonth(int year, int month) { if (month == 2) { if (isLeapYear ...
- POJ 1860 Currency Exchange (最短路)
Currency Exchange Time Limit : 2000/1000ms (Java/Other) Memory Limit : 60000/30000K (Java/Other) T ...
- ZOJ 1202 Divide and Count
原题链接 题目大意:某人手上有一大批钻石,他同时有一些盒子恰好放下这些钻石,每个盒子可以放一个或多个,问一共有几种方法. 解法:这其实是一道排列与组合计算题,主要是写出组合算法的代码,把计算公式转为程 ...
- C#部分---arraylist集合、arraylist集合中的object数据转换成int类string类等;间隔时间的表示方法;
ArrayList和Array的区别: 相同点:1.两者都实现了IList.ICollection.IEnumerable接口: 2.两者都可以使用证书索引访问集合中的元素,包括读取和赋值 ...
- JavaScript学习记录总结(七)——dom对象应用之用户简单管理
<!DOCTYPE html><html><head><title>users.html</title> <meta name=&qu ...
- 那些盒模型在IE6中的BUG们,工程狮的你可曾遇到过?
HTML5学堂 那些盒模型在IE6中的BUG们,工程狮的你可曾遇到过? IE6已经渐渐的开始退出浏览器的历史舞台.虽然当年IE6作为微软的一款利器击败网景,但之后也因为版本的持续不更新而被火狐和谷歌三 ...