Linux Shell管道调用用户定义函数（使shell支持map函数式特性）

Linux中有一个管道的概念，常用来流式的处理文本内容，比如一个文件对其中的每一行应用好几个操作，出于两个方面的考虑可能需要在管道中使用用户定义函数：

1. 刚需：内置的sed/awk之类的可能没法满足我们的需求，只能使用用户定义函数

2. 代码质量：如果是流式操作很多很长，那么可能就需要将其进行拆分，将相关的部分封装为一个函数，然后流式调用函数，这样程序的可读性更好，也更容易维护

在管道中上一个程序的标准输出会被放到下一个程序的标准输入，处在管道中的程序需要做的就是读取标准输入中的东西进行处理。

下面是一个在管道中使用用户定义函数的例子，print函数不断地从标准输入流中读取数据然后放到标准输出流中：

#! /bin/bash

print(){

	while read line

	do

		echo "$line"

	done

}

cat original.data | print

上面的例子是比较简单的，那么现在需求又改了，假设读入的每行都是一个数字，需要对数字加1并保存到一个新的文件，那么对上面的脚本进行扩充：

#! /bin/bash

add(){

	while read line

	do

		echo $(($line+1))

	done

}

save(){

	while read line

	do

		echo $line >> result.data

	done

}

print(){

	while read line

	do

		echo "$line"

	done

}

# cat original.data | print

cat original.data | add | save

上面的脚本虽然功能实现了，但是有冗余代码，在函数add和save中重复了循环读取输入流数据的代码，现在重构一下，将重复读取的部分抽象出来为一个新的函数map，此函数接受一个可以处理单行的函数的名字function_name，map函数每读取一行就调用function_name函数，将读取到的内容作为参数传入，如果处理单行的函数function_name还有输出，则还可以作为下一个管道命令的输入，这个处理模型类似于函数式编程中的map的概念，即这里通过一个小技巧使得shell支持部分函数式的功能。

现在按照上面的思想来对脚本进行改造：

#! /bin/bash

add(){

	echo $(($1+1))

}

save(){

	echo $1 >> result.data

}

print(){

	echo "$1"

}

map(){

	function_name=$1

	while read line

	do

		$function_name "$line"

	done

}

# cat original.data | print

cat original.data | map "add" | map "save"

现在看起来好多了，并且程序的可读性也得到了保障，但是如果我想对add传入一个参数指定究竟要加几怎么办呢，又或者我想在save函数自定义保存到位置又该怎么办呢？

这个很简单，在map中取完第一个参数之后就没再用了，直接shift参数然后直接传递即可，再重构一下代码：

#! /bin/bash

add(){

	echo $(($1+$2))

}

save(){

	echo $1 >> $2

}

print(){

	echo "$1"

}

map(){

	function_name=$1

	shift

	while read line

	do

		$function_name "$line" $@

	done

}

# cat original.data | print

cat original.data | map "add" 2 | map "save" "result.data"

看起来似乎很完美了，但还能做得更好吗？

如果map方法需要在其它地方调用怎么办？一种方法是将map抽取为utils.sh或者functional.sh之类的库，然后在使用的时候引入它即可，比如新建functional.sh的文件：

##################################################

#

#

#    shell 函数式库

#

#

##################################################

# $1 函数名

# $[2,] 传递给$1函数的参数

map(){

	function_name=$1

	shift

	while read line

	do

		$function_name "$line" $@

	done

}

使用的时候source functional.sh即可使用map函数。

或者更细粒度的，直接将map抽取为一个文件（以后如果有其它的类似函数也都会抽取为单独的文件），并且放到PATH中，这样使用的时候无需引入，直接就可以使用，比如创建一个文件叫做map：

##################################################

#

#

#    functional.map

#

#

##################################################

# $1 函数名

# $[2,] 传递给$1函数的参数

map(){

	function_name=$1

	shift

	while read line

	do

		$function_name "$line" $@

	done

}

map #@

但是这种方式有个陷阱就是一定要记得每次使用时保证map在$PATH中。

上面就是一步一步优化封装了一个小小的map函数使得shell支持map特性，虽然shell是一门面向字符串的语言，但是稍微对其封装就可以使其具备一些高级语言的特性，提高开发效率，使得程序可读性更好。

Linux Shell管道调用用户定义函数（使shell支持map函数式特性）的更多相关文章

应用C#和SQLCLR编写SQL Server用户定义函数
摘要: 文档阐述使用C#和SQLCLR为SQL Server编写用户定义函数,并演示用户定义函数在T-SQL中的应用.文档中实现的 Base64 编码解码函数和正则表达式函数属于标量值函数,字符串分割 ...
【翻译】Flink Table Api & SQL — 用户定义函数
本文翻译自官网:User-defined Functions https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/tabl ...
SQL——用户定义函数
根据用户定义函数返回值的类型,可将用户定义函数分为如下三个类别: (1) 返回值为可更新表的函数若用户定义函数包含单个 SELECT 语句且该语句可更新,则该函数返回的表也可更新,这样的函数称为内嵌 ...
SQL 中用户定义函数的使用方法
--用户定义函数的分类: /* 1.标量函数 2.表值函数 2.1内联表值函数返回单个SELECT语句, 它没有相关的返回变量和函数体 2.2多语句表值函数是视图和存储过程的结合可嵌套 */ ...
SqlServer——用户定义函数
根据用户定义函数返回值的类型,可将用户定义函数分为如下三个类别: (1) 返回值为可更新表的函数若用户定义函数包含单个 SELECT 语句且该语句可更新,则该函数返回的表也可更新,这样的函数称为内嵌 ...
SQL Server 2019 中标量用户定义函数性能的改进
在SQL Server中,我们通常使用用户定义的函数来编写SQL查询.UDF接受参数并将结果作为输出返回.我们可以在编程代码中使用这些UDF,并且可以快速编写查询.我们可以独立于任何其他编程代码来修改 ...
调试SQL Server的存储过程及用户定义函数
分类: 数据库管理 2005-06-03 13:57 9837人阅读评论(5) 收藏举报 sql server存储vb.net服务器sql语言 1.在查询分析器中调试查询分析器中调试的步骤如下: ...
Hadoop Hive概念学习系列之hive里的用户定义函数UDF（十七）
Hive可以通过实现用户定义函数(User-Defined Functions,UDF)进行扩展(事实上,大多数Hive功能都是通过扩展UDF实现的).想要开发UDF程序,需要继承org.apache ...
linux shell 管道命令(pipe)使用及与shell重定向区别
管道命令操作符是:”|”,它仅能处理经由前面一个指令传出的正确输出信息,也就是 standard output 的信息,对于 stdandarderror 信息没有直接处理能力.然后,传递给下一个命令 ...

随机推荐

Java如何查看死锁
Java中当我们的开发涉及到多线程的时候,这个时候就很容易遇到死锁问题,刚开始遇到死锁问题的时候,我们很容易觉得莫名其妙,而且定位问题也很困难. 因为涉及到java多线程的时候,有的问题会特别复杂,而 ...
PowerCLI
最近需要用命令行操作VMWare,现将一些经常用的命令记录一下.安装VMWare命令很简单,不再像原来需要单独下载PowerCLI安装包,直接在Powershell Gallery里在线安装即可. # ...
ES6 学习1
https://www.jianshu.com/p/287e0bb867ae 1,let表示变量.const表示常量.let和const都是块级作用域.一个在函数内部,一个在代码块内部: const ...
ACM数论之旅3---最大公约数gcd和最小公倍数lcm（苦海无边，回头是岸(￣∀￣)）
gcd(a, b),就是求a和b的最大公约数 lcm(a, b),就是求a和b的最小公倍数然后有个公式 a*b = gcd * lcm ( gcd就是gcd(a, b), ( •̀∀•́ ) ...
【设计模式】—— 原型模式Prototype
前言:[模式总览]——————————by xingoo 模式意图由于有些时候,需要在运行时指定对象时哪个类的实例,此时用工厂模式就有些力不从心了.通过原型模式就可以通过拷贝函数clone一个原有的 ...
半夜思考之查漏补缺, 在 Spring中, 所有的 bean 都是 Spring 创建的吗 ?
Spring 是一个 bean 容器, 负责 bean 的创建, 那么所有的 bean对象都是 Spring 容器创建的吗 ? 答案是否定的. 但是乍一想, 好像所有的对象都是 Spring 容器负责 ...
3Sum - LeetCode
目录题目链接注意点解法小结题目链接 3Sum - LeetCode 注意点和two sum那道题不一样的是这题返回的是具体的数字,不是下标解法解法一:将每个数字都作为target,剩下 ...
【BZOJ4197】【Noi2015】寿司晚宴
Description 为了庆祝 NOI 的成功开幕,主办方为大家准备了一场寿司晚宴.小 G 和小 W 作为参加 NOI 的选手,也被邀请参加了寿司晚宴. 在晚宴上,主办方为大家提供了 n−1 种不同 ...
《Linux内核设计与实现》第3章读书笔记
第三章进程管理一.进程 1.进程就是处于执行期的程序,但并不局限于可执行代码.实际上,进程是正在执行的程序代码的实时结果. 2.执行线程是在进程中活动的对象每个线程拥有一个独立的计数器.进程栈. ...
Linux及安全实践五——字符集编码
Linux及安全实践五——字符集编码一.ASCII码在表中查找出英文字母LXQ相对应的十六进制数值为: 4c 58 51 在终端中输入命令:vim test1.txt 在vim页面输入命令:%!x ...

Linux Shell管道调用用户定义函数（使shell支持map函数式特性）

Linux Shell管道调用用户定义函数（使shell支持map函数式特性）的更多相关文章

随机推荐

热门专题