Linux上设置RAID 10
RAID 10(又叫RAID 1+0或镜像条带)阵列结合了RAID 0和RAID 1两者的功能特性,从而提供了高性能、容错的磁盘输入/输出操作。在RAID 0中,读取/写入操作跨多个驱动器并路执行;在RAID 1中,一模一样的数据写入到两个或多个驱动器上。
在本教程中,我将介绍如何使用5只相同的8 GiB磁盘,构建一个软件RAID 10阵列。虽然用来构建RAID 10阵列的最大磁盘数量是4只(比如一组条带化的两个镜像),但我们将增添一只额外的备用驱动器,以防其中一个主驱动器出现故障。我们还将介绍一些工具,你以后可以用来分析RAID阵列的性能。
请注意:全面深入地介绍RAID
10及其他分区方案(以及不同尺寸的驱动器和文件系统)的所有优缺点不在本文的探讨范围之内。
RAID 10阵列是如何工作的?
如果你需要实施一种支持输入/输出密集型操作(比如数据库、电子邮件和网站服务器)的存储解决方案,RAID 10是正确的选择。下面会介绍其中原委。不妨先看一看下图。
镜像1和镜像2的条带

设想一下某个文件由上图中的数据块A、B、C、D和E组成。每个RAID 1镜像集(比如镜像1或镜像2)将数据块复制到两个设备中的每一个。由于这种配置,写入性能有所下降,因为每个数据块都要写入两次,每只磁盘各写入一次,而相比从单只读盘读取数据,读取性能依然没有变化。优点在于,这种方案提供了冗余性,因为除非每个镜像中的多只磁盘出现故障,否则可以维持正常的磁盘输入/输出操作。
RAID 0条带的工作原理是,把数据划分成多个数据块,并将数据块A写入到镜像1,同时将数据块B写入到镜像2,依次类推,因而提高了总体的读取和写入性能。另一方面,没有一个镜像含有向主集提交的任何一部分数据的完整信息。这意味着,如果其中一个镜像出现故障,整个RAID 0组件(以及因而RAID 10集)就无法操作,数据出现无法恢复的丢失。
构建RAID 10阵列
RAID 10阵列有两种可能的构建方案:复杂方案(只要一步就能构建),或嵌套方案(构建方法是,先构建两个或多个RAID 1阵列,然后把它们用作RAID 0中的组件设备)。在本教程中,我们将介绍构建复杂的RAID 10阵列,原因在于这种阵列让我们可以使用数量为奇数或偶数的磁盘,并且可以作为单一RAID设备来加以管理,而不是介绍嵌套方案(只允许数量为偶数的驱动器,必须作为嵌套设备来加以管理, RAID 1和RAID 0分开来处理)。
假设你已安装了mdadm,该后台程序在你的系统上运行。想了解详细内容,请参阅这篇教程:http://xmodulo.com/create-software-raid1-array-mdadm-linux.html。另外假设已在每只磁盘上创建了主分区sd[bcdef]1。因而,ls -l /dev | grep sd[bcdef]的输出应该是这样:

接下来使用下面这个命令,构建一个RAID
10阵列:
# mdadm --create
--verbose /dev/md0 --level=10 --raid-devices=4 /dev/sd[bcde]1 --spare-devices=1
/dev/sdf1

该阵列构建完毕后(构建过程应该用不了几分钟),# mdadm --detail /dev/md0的输出应该是这样:

在我们继续下一步之前有几点需要予以说明。
1. Used Dev
Space表明了阵列所使用的每个成员设备的容量。
2. Array Size是指阵列的总大小。就RAID 10阵列而言,这相当于(N*C)/M,其中N是指活动设备的数量,C是指活动设备的容量,M则指每个镜像中的设备数量。所以在这里,(N*C)/M相当于(4*8GiB)/2 =
16GiB。
3. Layout指数据布局的具体细节。可能的布局值如下所示。
•n(默认选项):意味着 near拷贝。一个数据块的多个拷贝在不同的设备中处于相似的偏移(offset)。这种布局提供的读取和写入性能与RAID 0阵列的性能相似。

•o表明offset拷贝。不是数据段在条带里面复制,而是整个条带被复制,但由一个设备轮转,那样重复数据块分布在不同的设备上。因而,随后的数据块拷贝在下一个驱动器中,下移一个数据段。想让你的RAID 10阵列使用这种布局,将--layout=o2添加到用来构建阵列的命令。

•f 表明far拷贝(偏移全然不同的多个拷贝)。这种布局提供了较好的读取性能,却提供了较差的写入性能。因而,这种方案最适合需要支持的读取操作比写入操作多得多的系统。想让你的RAID 10阵列使用这种布局,将--layout=f2添加到用来构建阵列的命令。

--layout选项中n、f和o后面所跟的数字表明了所需的每个数据块的副本数量。默认值是2,但它可以是磁盘中设备数量的2倍数。通过提供数量足够的副本,你就能尽量减少单个驱动器的输入/输出影响。
4. Chunk
Size,按照Linux RAID维基,数据段大小(chunk
size)指写入到设备的最小单位的数据。最优化的数据段大小取决于输入/输出操作的速度以及相关文件的大小。如果写入大文件,只要确保数据段相当大,有望看到较低的开销,而主要存储小文件的阵列有望更加得益于较小的数据段。想为你的RAID 10阵列指定某个数据段大小,将--chunk=desired_chunk_size添加到用来构建阵列的命令。
遗憾的是,没有一应俱全的方法可以提升性能。下面是值得考虑的几个指导准则。
•文件系统:总的来说,XFS据说是最好的文件系统,而EXT4仍然是个不错的选择。
•最佳化布局:far布局提升了读取性能,但降低了写入性能。
•副本数量:更多的副本尽量减小了输入/输出影响,但需要更多的磁盘时也增加了成本。
•硬件:固态硬盘比传统的旋转磁盘更有可能显示性能提升的优点(在同一环境下)。
使用DD测试RAID性能
下列基准测试可以用来核查我们的RAID
10阵列(/dev/md0)的性能。
1. 写入操作
256MB大小的单个文件被写入到设备上:
# dd
if=/dev/zero of=/dev/md0 bs=256M count=1 oflag=dsync
512字节被写入1000次:
# dd
if=/dev/zero of=/dev/md0 bs=512 count=1000 oflag=dsync
由于dsync标记,dd绕过系统文件缓存,执行同步写入到RAID阵列的操作。这个选项用来消除RAID性能测试期间的缓存效应。
2. 读取操作
256KiB*15000(3.9 GB)从阵列拷贝到/dev/null:
# dd if=/dev/md0
of=/dev/null bs=256K count=15000
使用Iozone测试RAID性能
Iozone(http://www.iozone.org)是一种文件系统基准测试工具,让我们可以测量的众多磁盘输入/输出操作,包括随机读取/写入、顺序读取/写入和重新读取/重新写入。它可以将结果导出到微软Excel或LibreOffice Calc文件。
将Iozone安装到CentOS/RHEL 7上
启用Repoforge软件库,然后执行下列命令:
# yum install
iozone
将Iozone安装到Debian 7上
# aptitude
install iozone3
下面这个iozone命令将在RAID-10阵列中执行所有测试:
# iozone -Ra
/dev/md0 -b /tmp/md0.xls
•-R:生成与Excel兼容的报告,并发送到标准输出设备。
•-a:在全自动模式下运行iozone,涵盖所有测试和可能的记录/文件大小。记录大小:4k至16M,文件大小:64k至512M。
•-b
/tmp/md0.xls:将测试结果存储在某个指定的文件。
但愿本文有所帮助。如果您对于提升RAID
10的性能方面有何想法或高招,欢迎交流。
Linux上设置RAID 10的更多相关文章
- 第7章 Linux上配置RAID
		7.1 RAID概念 RAID独立磁盘冗余阵列(Redundant Array of Independent Disks),RAID技术是将许多块硬盘设备组合成一个容量更大.更安全的硬盘组,可以将数据 ... 
- Linux上设置开机启动Java程序
		在Linux上设置开机启动Java程序,例如:test.jar 在Linux上启动Java程序的命令: nohup java -jar test.jar >/dev/>& & ... 
- 通过xshell在linux上安装solr4.10.3
		通过xshell在linux上安装solr4.10.3 0)下载linux下的安装包 1)通过xftp6上传到linux上 3)在xshell下依次执行 解压命令:tar xvfz solr.tgz( ... 
- 在Linux上使用的10种云备份方案
		导读 不久前,为用户提供一种备份远程机器上数据的简易方法还很稀奇.现在,我们已觉得这理所当然.Dropbox及其他公司简化了这项任务.苹果.谷歌和微软都提供各自的数据备份方法. 在Linux上,情况有 ... 
- linux上设置mysql编码
		linux下设置mysql编码 linux下设置mysql编码 首先查找MySql的cnf文件的位置: [root@flyHome gaoxiang]# find / -iname '*.cnf' - ... 
- 如何在Linux上设置SSH密码以进行无密码登录(转)
		ssh(secure shell)广泛用于远程登录Linux服务器.当我们使用ssh登录到远程系统时,它会提示输入密码,然后只允许我们登录到服务器.有时我们需要配置应用程序或脚本(主要是shell脚本 ... 
- 安装ORACLE时在Linux上设置内核参数的含义
		前两天看到一篇Redhat官方的Oracle安装文档,对于Linux内核参数的修改描述的非常清晰. 安装Oracle之前,除了检查操作系统的硬件和软件是否满足安装需要之外,一个重点就是修改内核参数,其 ... 
- Linux上安装postgres 10.5
		由于接触了华为的elk大数据平台,里面封装的是postgres ,就想着安装一下,熟悉一下postgres数据. 安装包下载:https://www.postgresql.org/ftp/source ... 
- Linux上设置memcached自启动
		#!/bin/sh # # memcached: MemCached Daemon # # chkconfig: - 90 25 # description: MemCached Daemon # # ... 
随机推荐
- axios中为所有请求带上Token头
			axios中为所有请求带上Token头 https://www.imooc.com/article/27751 
- 模板引擎freemarker的使用(二)
			freemarker默认配置使用时,如果传到前端的值为null或者不存在,后台会报错. 处理方法: <bean id="freemarkerConfig" class=&qu ... 
- [题解] codevs 1486 愚蠢的矿工
			http://codevs.cn/problem/1486/ 我们比较熟悉二叉树,题目中给出的是一棵多叉树,我们需要将这可二叉树改造成二叉树. 二叉树可以为这样的: 父亲结点左边储存儿子,右边储存兄弟 ... 
- JavaScript基础对象---Map
			一.创建Map对象 Map 对象保存键值对.任何值(对象或者原始值) 都可以作为一个键或一个值 1.构造函数 语法:new Map([iterable])参数: iterable 可 ... 
- 由Java实现Valid Parentheses
			一.题目 Given a string containing just the characters '(', ')', '{', '}', '[' and ']', determine if the ... 
- python_time和datetime模块
			time和datatime模块 时间相关的操作,时间有三种表示方式: 时间戳 1970年1月1日之后的秒,即:time.time() 格式化的字符串 2019-1-1 ... 
- 《C++专项练习》 — (2)
			序 C++基础专项练习二,,,水平依然不到家! 错题分析与总结 1 . 有如下模板定义: template <class T> T fun(T x,T y){ return x*x+y*y ... 
- 算法导论 第十章 基本数据类型 & 第十一章 散列表(python)
			更多的理论细节可以用<数据结构>严蔚敏 看几遍,数据结构很重要是实现算法的很大一部分 下面主要谈谈python怎么实现 10.1 栈和队列 栈:后进先出LIFO 队列:先进先出FIFO p ... 
- python基础——5(元组、字典、集合)
			上节复习: # 数字类型 # int:py3|py2 long:py2 # float: 3.14 # complex(5, 4) => 5 + 4j num = 12345678901234 ... 
- 【01】在 Github 上编辑代码
			[01]在 Github 上编辑代码 当你使用 GitHub,看一些文件(任何的文本文件或者仓库),能看到一个顶部右侧有一个小铅笔图标.点击即可编辑文档. 完成后,按照提示点击「Propose fil ... 
