需求:判断hadoop用户是否存在
**************************************************
#!/bin/bash
result=`awk -F ":" '{if($1=="hadoop") print $1}' /etc/passwd`
if [ -n result ]
then
echo "the $result is exists"
fi
运行:
./myawk.sh
**************************************************

如何判断NameNode进程是否启动
jps|awk '{if($2=="NameNode")print $2}'

**************************************************

用户名=>用户路径
vi myawk01.awk
BEGIN{
print "$$$$$$$$$$$$$"
FS=":"
OFS="=>"
}
{
print $1,$6

}
END{
print "@@@@@@@@@@@"
}

执行:
awk -f ./myawk01.awk /etc/passwd
**************************************************

#给输出信息加上表头( \t 表示空格   \n表示换行)
awk -F ":" 'BEGIN {print "name\tshell\n--------------------------------"}
{print $1"\t"$6}' /etc/passwd

----------------------------------------------------------
#给输出信息加上表头和末尾
awk -F : 'BEGIN {print "name\tshell\n--------------------------------"}
{print $1"\t"$6} END {print "end-of-report"}' /etc/passwd

awk -F ":" 'BEGIN {print"--BEGIN--"}$1=="root" { print $1} END{print"----END------"}' /etc/passwd


awk -F ":" 'BEGIN {print"--BEGIN--"}
{if( $1=="root") print $1}
END{print"----END------"}' /etc/passwd

-------------------------------------------------------------------

----------------------------------------------------------
正则表达式匹配格式
1)$n~正则表达式
2)if($n~正则表示式) print $0
----------------------------------------------------------

#打印以root开头的行
awk -F ":" '$0 ~ /^root/' /etc/passwd
#打印以ntp开头并以login结尾的行
awk -F : '$0 ~ /^ntp.*login$/ ' /etc/passwd
#打印包含nobody的行
awk -F : '{if($1~/nobody/) print $0}' /etc/passwd
#打印包含nobody或Nobody的行
awk -F : '{if($1~/[nN]obody/) print $0}' /etc/passwd
#打印n/N开头的行,
awk -F ":" 'BEGIN{print "userName"}{if($1~/^(n|N).*$/) print$0}' /etc/passwd
----------------------------------------------------------

#精确匹配|
#打印名字为root的用户在/etc/passwd文件中的记录
awk -F : '$1=="root" {print $0}' /etc/passwd
awk -F : '{ if($1=="root") print $0 }' /etc/passwd
----------------------------------------------------------
在awk中使用条件操作符
< 小于
>= 大于等于
<= 小于等于
== 等于
!= 不等于
~ 匹配正则表达式
!~ 不匹配正则表达式
----------------------------------------------------------
#或/与运算
awk -F : '$1~/(root|shawn)/ {print $0}' /etc/passwd
awk -F : '$1~/root/ || $1 ~/shawn/ {print $0}' /etc/passwd
awk -F : '{if($1~/root/ || $1 ~/shawn/) print $0}' /etc/passwd
awk -F : '$6~/home/ && $6~/shawn/ {print $0}' /etc/passwd
awk -F : '{if($1~/root/ || ($1~/shawn/)) print $0}' /etc/passwd
awk -F : '{if($1~/root/ || ($1~/shawn/)){print $0} else {print "other:"$0}}' /etc/passwd
awk -F : '{if($0!~/^ntp.*nologin$/) print $0}' /etc/passwd
----------------------------------------------------------
#内置变量
ARGC 命令行参数个数
ARGV 命令行参数排列
FS 设置输入域分隔符,与-F同 *****
NF 记录域的个数 *****
NR 已读的记录数 *****
OFS 输出域分隔符 *****
ORS 输出记录分隔符
RS 控制记录分隔符
----------------------------------------------------------
#FS的用法,注意FS要加双引号
awk 'BEGIN {FS=":"}{print $1}' /etc/passwd

#内置变量用法
BEGIN{
FS=":"
}
{
print $1,$6
}
END{
print "ddddd"
}
----------------
BEGIN {
FS=":"
OFS="="
}
{
print $1,$6
}
----------------
BEGIN {
FS=":"
OFS="="
}
{
print "Row " NR ":" $1,$6
}
----------------

BEGIN {
FS=":"
OFS="="
}
{
print "Row " NR ":" $1,$6,$NF
}
END{
print "当前共有" NF "列"
}
awk -f myawk.awk /etc/passwd

----------------------------------------------------------
#求和
awk -F " " 'BEGIN { SUM=0 } { SUM = SUM + $5 } END{ print "总额为:" SUM}' ./ employee.txt

封装到脚本方式:
BEGIN{
FS=" "
sum=0
}
{
sum=sum+$5
}
END{
print sum
}

将执行awk命令封装到shell脚本:
vi myawk03_sh.sh
#!/bin/bash
total= awk -f ./myawk03.awk ./employee.txt
echo "$total"

运行:
./myawk03_sh.sh

-------------------------------------------------------
#求平均值一
BEGIN {
FS=":"
SUM=0
}
{
SUM = SUM + $5
}
END{
print "平均值为:" SUM / NR
}
#求平均值二
BEGIN{
FS=" "
SUM=0
NUM=0
}
{
if($5 ~ /[0-9]+/){
SUM = SUM + $5
NUM = NUM + 1
}
}
END{
print "平均值为:" SUM / NUM
}

#求最大值
BEGIN {
FS=" "
MAX=0
}
{
if ($5 > MAX){
MAX = $5
}
}
END{
printf("最大值为:%d\n", MAX)
}

awk -f test4.awk employee.txt
----------------------------------------------------------
#数组应用一
BEGIN{
FS = " "
}
{
line[NR] = $0
}
END{
i = 1
while (i <=NR) {
print line[i]
i = i + 1
}
}
-----------------------------------------------------------
#数组应用二
BEGIN{
FS = ":"
}
{
line[NR] = $2
}
END{
for(i=1;i<=NR;i=i+1){
print line[i]
}
}

===================================================
1、统计各科修课人数
vi countstu.txt
xiaoA math 90
xiaoB chiese 23
xiaoD English 45
xiaoC jichu 76
xiaoM math 23
xiaoY chiese 12
xiaoK math 56
xiaoY math 23
xiaoQ math 34
xiaoY jichu 12
xiaoP jichu 100

vi countstu.awk

{
Number[$2]++
}
END{
for(course in Number)
printf("%10s %d\n", course, Number[course])
}

运行:
awk -f ./countstu.awk countstu.txt
-------------------------------------------------------
2、awk实现wordcount案例
vi words.txt
wo shi tiancai
wo bu shi tiancai que ding ma

运行方式一:
vi wordcount.awk
{
for (i = 1; i<=NF; i++)
freq[$i]++
}
END{
for (word in freq)
printf "%s%d\n",word,freq[word]
}
运行:
awk -f wordcount.awk words.txt

运行方式二:
vi wordcount_awk.sh
#!/bin/sh
awk -F " " '{
for (i = 1; i<=NF; i++)
freq[$i]++
}
END{
for (word in freq)
printf "%s%d\n",word,freq[word]
}' $1

chmod u+x wordcount_awk.sh
./wordcount_awk.sh words.txt

作业2:要求:将案例1和案例2使用shell脚本封装并且执行
注意:我已经删除一些字符!!!!

案例3:查看NameNode服务是否启动,如果没有启动就启动NameNode
process=`jps|grep -v Jps|awk -F " " '{if($2=="NameNode")print $2}'`
if [ -z $process ]
then
echo "the process is not running,start to running Namenode process..."
path=$(which hadoop-daemon.sh)
$path start namenode
echo "the NameNode process is running..."
else
echo "the NameNode process is already run"
fi

执行:
/bin/bash ./myawk05.sh

案例4:重写一个hdfs的重启动文件
#!/bin/bash
#get all process
all=`jps | grep -v Jps | awk -F " " '{print $1}'`
if [ -n "$all" ] ; then
echo 'found hadoop process is running...'
jps | grep -v Jps | awk -F ' ' '{print "shutdown proccess > " $2}'
kill -9 `jps | grep -v Jps | awk -F ' ' '{print $1}'`
echo 'restart process that you need...'
if [ -f "$HADOOP_HOME/sbin/hadoop-daemon.sh" ]; then
#/opt/bigdata/hadoop-2.7.1/sbin/start-dfs.sh
$HADOOP_HOME/sbin/hadoop-daemon.sh start namenode
$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
$HADOOP_HOME/sbin/hadoop-daemon.sh start secondarynamenode
fi
else
echo 'not found hadoop process is running...'
echo 'start process that you need...'
if [ -f "$HADOOP_HOME/sbin/hadoop-daemon.sh" ]; then
#/opt/bigdata/hadoop-2.7.1/sbin/start-dfs.sh
$HADOOP_HOME/sbin/hadoop-daemon.sh start namenode
$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
$HADOOP_HOME/sbin/hadoop-daemon.sh start secondarynamenode
fi
fi

----------------------------------------------------------

如何将awk脚本结合shell使用
需求:判断hadoop用户是否存在
**************************************************
#!/bin/bash
result=`awk -F ":" '{if($1=="hadoop") print $1}' /etc/passwd`
if [ -n result ]
then
echo "the $result is exists"
fi
运行:
./myawk.sh

awk脚本结合shell使用的更多相关文章

  1. awk如何向shell传值

    今天写脚本,遇到awk脚本向shell传参的情况,上网谷歌一下,发现都有些麻烦,通过管道,通过eval,感觉都很复杂.于是想到用read来试一下. 首先构造一个测试文件test.txt,里面的内容是1 ...

  2. Shell awk文本处理,shell脚本编写

    Shell awk文本处理,shell脚本编写 一:内容包含awk.变量.运算符.if多分支 <a>语法糖: awk [options] 'commands' files option - ...

  3. awk脚本

    $0,意即所有域. 有两种方式保存shell提示符下awk脚本的输出.最简单的方式是使用输出重定向符号>文件名,下面的例子重定向输出到文件wow. #awk '{print $0}' grade ...

  4. awk中引用shell变量的方法

    1.通过命令行参数定义变量时引用: awk -v awk变量名= shell变量名 #!/bin/bash var4bash=test awk -v var4awk="$var4bash&q ...

  5. Awk中调用shell命令

    Awk中调用shell命令 需求 在awk中,有时候需要调用linux系统中命令,如计算字符串的MD5值,并保存下来. 方法参考 call a shell command from inside aw ...

  6. ./ . 和#!/bin/bash 辨析Linux如何选择当前执行脚本的shell

    最近遇到一个有趣的问题,让我搞清楚Linux如何选择当前执行脚本的shell 执行cts的的 media stress test 需要安装 android-cts-media-1.0.zip 把这个文 ...

  7. awk中使用shell的环境变量

    awk中使用shell的环境变量一:"'$var'"这种写法大家无需改变用'括起awk程序的习惯,是老外常用的写法.如:var="test"awk 'BEGIN ...

  8. awk 脚本同时解析多个文件

    ARGC        The number of command line arguments (does not include                   options to gawk ...

  9. shell脚本学习—Shell执行脚本

    Shell作用是解释执行用户的命令,用户输入一条命令,Shell就解释执行这一条,这种方式称为交互式,但还有另一种执行命令的方式称为批处理方式,用户事先写一个Shell脚本,Shell可以一次把这些命 ...

  10. python调用脚本或shell的方式

    python调用脚本或shell有下面三种方式: os.system()特点:(1)可以调用脚本.(2)可以判断是否正确执行.(3)满足不了标准输出 && 错误 commands模块特 ...

随机推荐

  1. .NET 代理模式(二) 动态代理-DispatchProxy

    前言 我们都知道,在.NET中实现动态代理AOP有多种方案,也有很多框架支持,但大多框架的实现原理都是通过Emit配合Activator一起使用,从IL级别上实现动态代理. 其实在.NET中有一个更为 ...

  2. bond网卡

    目录 一.bond概述 1.1.bond的优点 二.bond模式 2.1.mode=0 2.2.mode=1 2.3.mode=2 2.4.mode=3 2.5.mode=4 2.6.mode=5 2 ...

  3. wblockCloneObjects 写块克隆的使用

    写块克隆可以把当前数据库的实体写入到另一个dwg文件中去.用法根deepclone类似,不过deepclone只能复制到同一数据库中,而写块克隆是在不同数据库中进行复制的.写块克隆也算是深度克隆,能把 ...

  4. Django——form组件之循环生成标签

    from django.contrib import admin from django.urls import path from app01.views import index urlpatte ...

  5. 资源编排ROS之模块:实现模板代码复用(基础篇)

    背景 资源编排服务(Resource Orchestration Service, 简称ROS)是阿里云提供的一项简化云计算资源管理的服务.您可以遵循ROS定义的模板规范编写资源栈模板,在模板中定义所 ...

  6. 一文搞懂C++继承、多继承、菱形继承、虚继承

    继承 目录 继承 继承 继承的访问权限 子类赋值给父类 赋值兼容规则 "天然"的行为 验证: 1. 其他权限继承能否支持赋值兼容规则 2.是否"天然",有没有产 ...

  7. react 高阶函数

    HOC(Higher Order Components)就是一个函数,传给它一个组件,它返回一个新的组件. 高阶组件:就相当于手机壳,通过包装组件,增强组件功能. 实现步骤: 首先创建一个函数 指定函 ...

  8. kettle从入门到精通 第十三课 kettle 字符串操作

    1.本次示例讲解一些常用的字符串操作,有字段拼接,枚举值转换,计算器.字符串替换.字段拆分. 2.输入元数据有firstName.secondName.sex.salary.englishName.o ...

  9. 在 Windows 10、Windows 11 中打开 IE 浏览器

    在 Windows 10.Windows 11 中打开 IE 浏览器 新建 OpenIE.vbs 文件,输入以下内容后保存: Set OpenIE = CreateObject("Inter ...

  10. Javascript高级程序设计第二章 | ch2 | 阅读笔记

    HTML中的Javascript <script>元素 值得注意的几个关键字: async:立即开始下载脚本,仅对外部脚本有效.给脚本添加 async 属性的目的是告诉浏览器,不必等脚本下 ...