彻底搞懂shell的高级I/O重定向
bash&shell系列文章:http://www.cnblogs.com/f-ck-need-u/p/7048359.html
基本的重定向功能想必都理解。本文对shell环境下的IO重定向稍作深入,相信看完后,能够彻底理解 >file >& 。
文件描述符(file description,fd)
文件描述符是IO重定向中的重要概念。文件描述符使用数字表示,它指明了数据的流向特征。
软件设计认为,程序应该有一个数据来源、数据出口和报告错误的地方。在Linux系统中,它们分别使用描述符0、1、2来表示,这3个描述符默认的目标文件(设备)分别是/dev/stdin、/dev/stdout、/dev/stderr,它们分别是各个终端字符设备的软链接。
[root@mariadb ~]# ll /dev/std*
lrwxrwxrwx root root Apr : /dev/stderr -> /proc/self/fd/
lrwxrwxrwx root root Apr : /dev/stdin -> /proc/self/fd/
lrwxrwxrwx root root Apr : /dev/stdout -> /proc/self/fd/ [root@mariadb ~]# ll /proc/self/fd/
total
lrwx------ root root Apr : -> /dev/pts/
lrwx------ root root Apr : -> /dev/pts/
lrwx------ root root Apr : -> /dev/pts/
lr-x------ root root Apr : -> /proc//fd
在Linux中,每一个进程打开时都会自动获取3个文件描述符0、1和2,分别表示标准输入、标准输出、和标准错误,如果要打开其他文件,则文件描述符必须从3开始标识。对于我们人为要打开的描述符,建议使用9以内的描述符,超过9的描述符可能已经被系统内部分配给其他进程。
文件描述符说白了就是系统为了跟踪这个打开的文件而分配给它的一个数字,这个数字和文件绑定在一起,数据流入描述符的时候也表示流入文件。
而Linux中万物皆文件,这些文件都可以分配描述符,包括套接字。
程序在打开文件描述符的时候,有三种可能的行为:从描述符中读、向描述符中写、可读也可写。从lsof的FD列可以看出程序打开这个文件是为了从中读数据,还是向其中写数据,亦或是既读又写。例如,tail命令监控文件时,就是打开文件从中读数据的(3r的r是read,w是write,u是read and write)。
[root@mariadb ~]# lsof -n | grep "/a.sh" | column -t
tail root 3r REG , /root/a.sh
文件描述符的复制(duplicate)
文件描述符的复制表示复制文件描述符到另一个文件描述符中以作其副本。使用"&"进行复制。
[n]<&word :将文件描述符n复制于word 代表的文件或描述符。可以理解为文件描述符n重用word代表的文件或描述符,即word原来对应哪个文件,现在n作为它的副本也对应这个文件。n不指定则默认为0(标准输入就是0),表示标准输入也将输入到word所代表的文件或描述符中。 [n]>&word :将文件描述符n复制于word 代表的文件或描述符。可以理解为文件描述符n重用word代表的文件或描述符,即word原来对应哪个文件,现在n作为它的副本也对应这个文件。n不指定则默认为1(标准输出就是1),表示标准输出也将输出到word所代表的文件或描述符中。
例如,3>&1表示fd=3复制于fd=1,而fd=1目前的重定向目标文件是/dev/stdout(fd=1指向与输出设备是默认的),因此fd=3也重定向到/dev/stdout,以后进程将数据写入fd=3的时候,将直接输出到屏幕。这里的3>&1等价于3>&/dev/stdout。如果用"复制"来理解,就是fd=3是当前fd=1的一个副本,即指向/dev/stdout设备。如果后面改变了fd=1的输出目标(如file1),由于fd=3的目标仍然是/dev/stdout,所以可以拿fd=3来还原fd=1使其目标变回/dev/stdout。
(fd=) --> /dev/stdout
|
>&
\|/
(fd=) --> /dev/stdout
关于文件描述符的duplicate
在操作系统(或C)中,对于实体文件的文件描述符来说,文件描述符是用来描述它所指向的实体文件的。例如fd=5指向文件a.txt。复制(duplicate)实际上是执行dup()函数,表示创建另一个文件描述符(例如fd=6),指向同一个底层对象,例如指向同一个实体文件。这时fd=5和fd=6都将指向a.txt。
在shell中,我们将文件描述符和实体文件的关联关系(或者称为指向的关系)称为重定向,其实用更底层的指向关系更容易理解。例如,"3>&1"表示复制fd=1,使得fd=3和fd=1都指向同一个对象,也就是stdout。
再例如,cat <&1表示fd=0复制于fd=1上,而此时fd=1的重定向文件是/dev/stdout,所以fd=0也指向这个/dev/stdout文件,而cat从fd=0中读取标准输入,于是/dev/stdout既是标准输入设备,也是标准输出设备,也就是说进程从/dev/stdout(屏幕)接受输入,输入后再直接输出到/dev/stdout。以下是结果:
[root@mariadb ~]# cat <&
q # 进入交互式,输入数据
q # 直接输出
最后需要说明的是一种特殊情况,如果是>&word,且word不是一个数值,比如 echo haha >&/tmp/a.log ,那么>&word和&>word是等价的,都表示>word 2>&1。参考man bash的"Redirecting Standard Output and Standard Error"段落。
重定向顺序很重要:">file 2>&1"和"2>&1 >file"
想必很多人都知道>file 2>&1的作用,它等价于&>file,表示标准输出和标准错误都重定向到file中。那它和2>&1 >file有什么区别呢?
首先解释>file 2>&1。这里分两个过程:先打开file,再将fd=1重定向到file文件上,这样file文件就成了标准输出的输出目标;之后再将fd=2复制于fd=1,而fd=1此时已经重定向到file文件上,因此fd=2也重定向到file上。所以,最终的结果是标准输出重定向到file上,标准错误也重定向到file上。
再解释2>&1 >file。这里也分两个过程:先将fd=2复制于fd=1,而此时fd=1重定向的文件是默认的/dev/stdout,所以fd=2也重定向到/dev/stdout;之后再将fd=1重定向到file文件上。也就是说,这里的标准错误和标准输出仍然是分开输出的,只不过是使用/dev/stdout替代了/dev/stderr,使用file替代了/dev/stdout。所以,最终的结果是标准错误输出到/dev/stdout,即屏幕上,而标准输出将输出到file文件中。
可以使用下面的命令来测试2>&1 >file。第一个ls命令是正确的,结果输出到/tmp/a.log中,第二个ls命令是错误的,结果将直接输出到屏幕上。
[root@mariadb ~]# ls /boot >& >/tmp/a.log
[root@mariadb ~]# ls sjdfk >& >/tmp/a.log
ls: cannot access sjdfk: No such file or directory
改变当前shell环境的重定向目标
如果在命令中直接改变重定向的位置,那么命令执行结束的时候描述符会自动还原。正如上面的ls /boot 2>&1 >/tmp/a.log命令,在ls执行结束后,fd=2还原回默认的/dev/stderr,fd=1还原回默认的/dev/stdout。
但是我们可以通过exec程序直接在当前的shell环境下改变重定向目标,只有在当前shell退出的时候才会释放描述符的绑定。
例如:下面的命令将标准错误fd=2指向fd=3对应的文件上。
exec >&
因此,我们可能在一段程序执行结束后,需要将描述符还原到原来的位置,并关闭不再需要的描述符。毕竟描述符也是资源,是有限的(ulimit -n)。
关闭文件描述符
[n]>&-
[n]<&-
关闭文件描述符的方式是将 [n]>&word 和 [n]<&word 中的word使用符号"-",这表示释放fd=n描述符,且关闭其指向的文件。
打开文件
[n]<> filename :打开filename,并指定其文件描述符为n,该描述符是可读、可写的描述符。若不指定n则默认为0,若filename文件不存在,则先创建filename文件。
例如:
[root@mariadb ~]# exec <> /tmp/a.log
[root@mariadb ~]# lsof -n | grep "/a.log" | column -t
bash root 3u REG , /tmp/a.log
如果再exec 1>&3将fd=1复制于fd=3,那么/tmp/a.log就成了标准输出的目标。
文件描述符的移动
文件描述符的移动表示将文件描述符1移动到描述符2上,同时关闭文件描述符1。
[n]>&digit- :将文件描述符digit代表的输出文件移动到n上,并关闭digit值的描述符。
[n]<&digit- :将文件描述符digit代表的输入文件移动到n上,并关闭digit值的描述符。
例如:
[root@mariadb ~]# exec <> /tmp/a.log
[root@mariadb ~]# lsof -n | grep "/a.log" | column -t
bash root 3u REG , /tmp/a.log
[root@mariadb ~]# exec >&- # 将3移动到1上,关闭3
[root@mariadb ~]# lsof -n | grep "/a.log" | column -t # 在另一个bash窗口查看
bash root 1u REG , /tmp/a.log
可见,fd=3移动到fd=1后,原本与fd=3关联的/tmp/a.log已经关联到fd=1上。
经典示例
(1). 示例一:
以下是《Advanced Bash-Scripting Guide》中的示例:
echo > File # ().写字符串到"File".
exec <> File # ().打开"File"并且给它分配fd .
read -n <& # ().只读4 个字符.
echo -n . >& # ().写一个小数点.
exec >&- # ().关闭fd .
cat File # ().1234.67890
(1)向文件File中写入几个字符。
(2)打开文件File以备read/write,并分配fd=3给该文件。
(3)将fd=0复制于fd=3上,而fd=3的重定向目标为File,所以fd=0的目标也是File,即从File中读取数据。这里读取4个字符,由于read命令中没有指定变量,因此分配给默认变量REPLY。注意,这个命令执行结束后,fd=0的重定向目标会变回/dev/stdin。
(4)将fd=1复制于fd=3上,而fd=3的重定向目标文件为File,所以fd=1的目标也是File,即数据写入到File中。这里写入一个小数点。注意,这个命令结束后,fd=1的重定向目标回变回/dev/stdout。
(5)关闭fd=3,这也会关闭其指向的文件File。
(6)File文件中已经写入了一个小数点。如果此时执行echo $REPLY,将输出"1234"。
(2). 示例二:关于描述符恢复、关闭
exec >& # ()
exec > /tmp/file.txt # ()
echo "---------------" # ()
exec >& >&- # ()
echo "===============" # ()
(1)首先将fd=6复制于fd=1,此时fd=1的重定向目标为/dev/stdout,因此fd=6的重定向目标为/dev/stdout。
(2)将fd=1重定向到/tmp/file.txt文件。此后所有标准输出都将写入到/tmp/file.txt中。
(3)写入数据。该数据将写入到/tmp/file.txt中。
(4)将fd=1重新复制回fd=6,此时fd=6的重定向目标为/dev/stdout,因此fd=1将恢复到/dev/stdout上。最后将fd=6关闭。
(5)写入数据,这段数据将输出在屏幕上。
可能你会疑惑,为什么要先将fd=1复制于fd=6,再用fd=6来恢复fd=1,恢复的时候直接将fd=1重定向回/dev/stdout不就可以了吗?
实际上,这里借用fd=6这个中转描述符是为了方便操作。可以不用它,但是在恢复fd=1的重定向目标的时候,应该重定向到`/dev/{伪终端字符设备}`上,而不是/dev/stdout,因为/dev/stdout是软链接,其目标指向/proc/self/fd/1,但该文件还是软链接,它指向/dev/{伪终端字符设备}。同理/dev/stdin和/dev/stderr都一样。
因此,如果你当前所在的终端如果是pts/2,那么可以使用下面的命令来实现上面同样的功能:
exec > /tmp/file.txt
echo "---------------"
exec >/dev/pts/
echo "===============" exec >/dev/tty # 这样更方便
如果不借用fd=6这个中转描述符,你要先去获取并记住当前shell所在的终端,很不方便。但可以使用/dev/tty这个文件来表示当前所在终端,这会方便的多。
但如果要恢复的不是终端相关的文件,那么可能就只能通过文件描述符的备份、还原来恢复了。
最后给张描述符复制、恢复的过程实例图:

使用变量作为文件描述符
有时候一些特殊的需求下,可能想要使用变量来保存所分配的文件描述符,从而让多个手动打开的文件夹描述符不至于前后混乱。
要用变量保存文件描述符,可以采用如下方式:
fd=
eval "exec ${fd}<> /tmp/a.log"
lsof -n | grep a.log
在bash 4.1之后,bash自身提供了变量文件描述符的功能,只要在需要分配文件描述符的时候将原来的fd指定为 fdvar 即可创建这个变量,在分配文件描述符后会自动将其保存到变量fdvar中。使用这种模式时,文件描述符是从10开始分配的,所以fdvar是大于等于10的值。
exec {fd1}<> /tmp/a.log
echo $fd1 # 输出:
exec {fd2}<> /tmp/a.log
echo $fd2 # 输出:
彻底搞懂shell的高级I/O重定向的更多相关文章
- 一篇文章搞懂高级程序员、架构师、技术总监、CTO从薪资到技能的区别
一篇文章搞懂高级程序员.架构师.技术总监.CTO从薪资到技能的区别 http://youzhixueyuan.com/senior-programmers-architects-technical-d ...
- 搞懂ELK并不是一件特别难的事(ELK)
本篇文章主要介绍elk的一些框架组成,原理和实践,采用的ELK本版为7.7.0版本 一.ELK介绍 1.1.ELK简介 ELK是Elasticsearch.Logstash.Kibana三大开源框架首 ...
- 搞懂分布式技术9:Nginx负载均衡原理与实践
搞懂分布式技术9:Nginx负载均衡原理与实践 本篇摘自<亿级流量网站架构核心技术>第二章 Nginx负载均衡与反向代理 部分内容. 当我们的应用单实例不能支撑用户请求时,此时就需要扩容, ...
- 后端技术杂谈9:先搞懂Docker核心概念吧
本系列文章将整理到我在GitHub上的<Java面试指南>仓库,更多精彩内容请到我的仓库里查看 https://github.com/h2pl/Java-Tutorial 喜欢的话麻烦点下 ...
- 彻底搞懂 etcd 系列文章(一):初识 etcd
0 专辑概述 etcd 是云原生架构中重要的基础组件,由 CNCF 孵化托管.etcd 在微服务和 Kubernates 集群中不仅可以作为服务注册与发现,还可以作为 key-value 存储的中间件 ...
- 升级过log4j,却还没搞懂log4j漏洞的本质?
摘要:log4j远程代码漏洞问题被大范围曝光后已经有一段时间了,今天完整讲清JNDI和RMI以及该漏洞的深层原因. 本文分享自华为云社区<升级过log4j,却还没搞懂log4j漏洞的本质?为你完 ...
- 彻底搞懂Javascript的“==”
本文转载自:@manxisuo的<通过一张简单的图,让你彻底地.永久地搞懂JS的==运算>. 大家知道,==是JavaScript中比较复杂的一个运算符.它的运算规则奇怪,容让人犯错,从而 ...
- 完全搞懂傅里叶变换和小波(2)——三个中值定理<转载>
书接上文,本文章是该系列的第二篇,按照总纲中给出的框架,本节介绍三个中值定理,包括它们的证明及几何意义.这三个中值定理是高等数学中非常基础的部分,如果读者对于高数的内容已经非常了解,大可跳过此部分.当 ...
- 完全搞懂傅里叶变换和小波(1)——总纲<转载>
无论是学习信号处理,还是做图像.音视频处理方面的研究,你永远避不开的一个内容,就是傅里叶变换和小波.但是这两个东西其实并不容易弄懂,或者说其实是非常抽象和晦涩的! 完全搞懂傅里叶变换和小波,你至少需要 ...
随机推荐
- JavaScript中的私有成员[翻译]
原作者:Douglas Crockford,原文地址:http://www.crockford.com/javascript/private.html JavaScript 是世界上被误解最深的编程语 ...
- 【python学习笔记】4.字典:当索引不好用时
[python学习笔记]4.字典:当索引不好用时 字典是python中唯一内建的map类型 创建: key可以为任何不可改变的类型,包括内置类型,或者元组,字符串 通过大括号: phonebook={ ...
- vmware虚拟机各个版本的安装破解(附安装包和注册机)
VMware 是平时我们常用的虚拟机软件,特别是我们平时想试试其他的系统,比如说linux系统的时候但是又不想安装双系统,那么这个时候我们就可以试试这款虚拟软 件,如果你的电脑配置(主要是内存)够好的 ...
- 设计模式——职责链模式(C++实现)
#include <iostream> #include <string> using namespace std; class Handler { public: Handl ...
- Jmeter + Ant 测试环境搭建 及解决问题: the <jmeter> type doesn't support nested text data
1.首先确保测试机器中已经按照jdk1.6以上版本,如果没有,那就上官网下载吧. 2.下载Ant,解压至指定目录,并配置好环境变量:http://ant.apache.org/ 在命令行下执行ant ...
- 用vue开发一个app(4,一个久等了的文章)H5直播平台登录注册(1)
我上一篇关于vue的文章和这一篇时间隔了有点久了.最近终于写完了. 因为我一直想写个有点实绩的东西,而不是随便写一个教程一样东西.结合最近在项目中学到的经验和我的一点创意. 首先介绍下这是个什么! H ...
- 误删 /user/bin目录后的补救
当危险的动作发生, 误删 /user/bin目录后的补救 以下是昨天晚上真实的误操作现场,模拟记录一下 (这是测试环境,所以操作得很随意,有些执行动作很不规范) 在上面编译一个软件Dboop,完事以后 ...
- [Tarjan 学习笔记](无向图)
今天考试因为不会敲 Dcc 的板子导致没有AK(还不是你太菜了),所以特地写一篇博客记录 Tarjan 的各种算法 无向图的割点与桥 (各种定义跳过) 割边判定法则 无向边 (x,y) 是桥,当且仅当 ...
- 【Python】 配置解析ConfigParser & 命令行参数解析optparser
ConfigParser ConfigParser包装了配置文件的读取和写入,使得python程序可以更加轻松操作配置文件了.这里的配置文件是指.ini的那种文件,基本格式如下 [section_a] ...
- 国内可用的Internet时间同步服务器地址(NTP时间服务器)
不知道什么鬼我这系统自带的Internet时间同步服务器地址居然不可用,终端ping系统自带服务器两个居然都不通???难道时间服务器也和谐么? 好在阿里云提供了7个NTP时间服务器也就是Interne ...