shell 学习笔记1501-1800
.巧用bash的{}扩展备份目录:
cp file.txt{,.bak}
.利用at执行一次性命令:
echo "ls -l" | at midnight #Execute a command at a given time
.kill - 或者 kill -HUP 一般用来重新读取配置文件:(一般程序自己实现的)
HUP 其实就是给个信号,你的程序可以根据这个信号做一些事情,比如reload进程,或者是rotota日志。例如 squid、Nginx、xinetd。
kill就是发送一个信号,而各种信号一般都有默认的意义,但是各个软件不一样。比如ping在遇到3信号的时候就会输出统计。
nohup,就是对应的这个信号 HUP。
.Read-only file system:文件系统只读
如果/data在/分区上:mount -o remount /data,其实/分区也可以remount的,只是不能umount
原因:磁盘io很高、硬盘挂掉、死机等
mount -o remount,rw /data rw好像是预设值,既然有nodiratimne,加上noatime吧
.巧用正则的匹配位置 RSTART 和匹配长度 RLENGTH 寻找子串:
$ echo 'QWADGDABCfooDGJDJLGJWLJABCbarGLDABCwhyJGKABCkkJGJKDJGLABCtnndJDK'|、
awk '{while(match($0,/ABC/)){print substr($0,RSTART);$0=substr($0,RSTART+RLENGTH)}}'
.多次调用 -k 实现多次排序:
sort -t -k1, #sort -k中的.表示按指定域中的第几个字符来排序
.重启网络用sudo /etc/init.d/networking restart,或者ifdown eth0 ifup eth0,注意要一起执行,否则你网络就断了。
.二进制文件编辑不要用vi,你保存后会在最后加换行,会破坏这个文件。vi会检查文件,如果没换行,会加上,二进制文件最后一般都没换行的。
你复制个/bin/ls,用vi打开,什么都不做,保存,wc -c看下,多一个字符。
.EOF 不是字符,EOF是个信号,告诉程序没了。
.保留相邻重复行:
echo "aaa
aaa"|awk 'a[$1]&&NR!=a[$1]+1{next}{a[$1]=NR}1'
.man cat出现 ^H 字符:
man cat |col -b > cat-help :^H是高亮显示用的
echo 'a^Ha'|less,a就高亮了,^H是按ctrl+v,再ctrl+h输入的
BTW:为何退格出现 ^H :打字机时代,要加亮一个字符,操作方法是敲一次字符,回退,然后再重复敲一遍。(见维基百科)
.IFS设为换行符:IFS=$'\n'
.利用 find -prune 限制查找多个目录:
find / \( -path /root/decli -o -path /data/robinechen -o -path /data/yunwei \) -prune -o -type f -name "*vim*" -print
.巧用逻辑操作打印 rm 的报错状态:
rm a || echo error &
rm a & ; [ $? -ne ] && echo error # 实际上即使 rm a 出错,也不能打印出 error
.巧设RS合并行:
echo
\n
awk -v RS='\0' -F'\\\\n\n' '{for(i=1;i<=NF;i++){printf $i}}'
.获取进程列表及进程路径:
netstat -nlp|awk -F '[ ]+|/' 'NR>2{if($0 ~/Active UNIX/){exit};res=gensub(".* +([0-9]+)/[^/]+","\\1",1,$0);a[res]}END{for(i in a){print i}}'|xargs -I {} ls -l /proc/{}|grep -E 'exe|cwd'|awk '{print}NR%2==0{print ""}'
.cut 也有输出分隔符:
echo -d' ' --output-delimiter=o
.delete和backspace都无效:reset 或者 stty cooked 试试
.linux下创建 dvd ISO 镜像:
dd if=/dev/cdrom of=~/cdimage.iso
.利用bash转义改变grep搜索颜色:
echo $'\e'[31m; grep "$1" aaa; echo $'\e'[37m
.打印第2行到倒数第2行:sed '1d;$d'
.关于 kill - 进程杀不掉:
ps -eo stat,pid,cmd|grep httpd,看下进程状态
都D了,通常是IO导致的深度睡眠,lsof看下在干嘛,
kill -9也杀不掉?恩,D和Z都是-9杀不掉的,D只能等io结束。
.seq -s 设置序列分隔符:
seq -s, #echo {..},|sed 's/,$\| //g'
seq -s, |awk '{for(i=1;i<=9;i++)print gensub(i,"null",1,$0)}'
.通过多次的幂运算将CPU迅速撑到 %:
^^|bc &>/dev/null ;done # 多核的话需要起多个进程丢到后台
.linux下如何打印出指定进程的进程树,而不是pstree打印全部的:pstree -ps pid
.sort 如果用-k指定了的话,那么n就要后置,如 sort -k2, -k1rn
.paste 把标准输入按列拼接成行:
seq |paste - - - - - # xargs -n5
注意:不同于多个输入:paste <(seq ) <(seq )
.expect 在send密码之前有些系统需要 sleep 一下或者 ,否则导致密码在提示之前捕获而报错,可以expect -d 调试下
.删除 windows 下的 ^M 回车换行符:
tr -d '[:cntrl:]' ; dos2unix;tr -d \\r;sed -i '/^M/d' # ctrl -v -M
.统计文件夹大小:
du -hx --max= ; du -sk ;du -hsc
.关于shell/awk的随机数:
随机数伪随机,是根据随机种子计算出来的,随机种子确定,随机数就确定。
awk的随机种子默认是当天的天数。那怎么修改这个随即种子?srand()
一般用纳秒做随机种子,不过好像awk只能获取到秒,就是同一秒执行的话随机数还是一样的。
随机数是可能有重复的,因为是随机产生的。
.一个文件末尾没有换行符,怎么加个换行符:$'\n'
tail -c -1判断,如果不是换行,就echo >>加一个,
或者你这样,先echo >>,然后在去掉空行,这样就不用判断了
很多windows编辑软件会很“贴心”得去除文件最后一个换行,vim是会很贴心的加上最后一个换行,除非是空文件,不动。
.关于shell解析一次,awk再解析一次转义符的例子:
awk 'BEGIN{print "\\("}' # 双引号内的\\( 被shell解析了一个
\(
echo "1(2)3"|awk -F '\\(2' '{print $2}' # ( 不转义是组合
)
awk "BEGIN{print '1'}" # awk以单引号为分隔符,所以里面不能用单引号。除非你用""去掉单引号的作用,就像shell下一样
awk: ^ invalid char ''' in expression
.巧用 RS、RT 匹配双引号段,去掉非双引号空格:
echo 'abc 234 fsdfds 555 "34 666 53242 " asaf tttttt'|awk -vRS='"[^"]+"' '{gsub(/ +/," ");printf $0 RT}'
abc fsdfds "34 666 53242 " asaf tttttt # 注意双引号要偶数个出现,RT 会针对每一行进行动态变化。
.base64 的编码与解码:base64 -d <<<anVuZV8xMjAxQHFxLmNvbQo=
.用find 找到几千个文件,然后想用 xargs 结合 tar打包,为什么tar包里面只有部分数据:
xargs --show-limits看下,如果你的命令超过命令行长度限制,会自动切分,用tar -r,这样就好了
.rsync 显示远端服务器目录列表:rsync -avz dst
.linux 下 .so文件找不到 一般是ld的cache目录没更新,执行了一下ldconfig,就正常了。
.变量不加双引号在某些特定情况下被解析为 IFS 而显示为空:
a="";echo $a|xxd ;a=$'\n';echo $a|xxd ;a=" ";echo $a|xxd
空格和\n都是IFS,所以echo $a=echo, 所以要用"$a",因为不加双引号,空格被认为是IFS,跳过,因为只有零个参数,所以结果就是空
.用 read -N1 捕获 回车符 \n:
read -N3 a
echo "$a" && echo "$a"|xxd
.sed 中行范围扩展匹配:
seq | sed -e{,,,}'s/.*/--/' #行范围不固定的扩展匹配
.sort -g 把科学计数法按普通数字排序
.删除乱码:LANG=C tr
.seq 等宽并指定分隔符: seq -w -s,
用echo 或者 ;i<=;i++)); }; done 或者 printf 格式化
.sort -k n.m 按某列字符排序:sort -k .2n #第一列按字典排,第二列之后按数字排
.shell变量为了防止 word split,需要加上引号:
june@~ ::>
a=`echo -e "1\n2"` && echo $a
june@~ ::>
echo "$a"
june@~ ::>
.找出bash数组是否有元素“匹配”(不是存在)给定字符串:
a=( abc) && [[ "${a[@]}" =~ 'ab' ]] && echo '------match' # 也可以用 grep -q
.合并前两列:sed -r 's/\s+//'
.awk的asorti 是把下标按字典排序,可以得到新的下标数组与数组长度,二次引用即可获取原数组 value
awk '{n=$1;getline;h[n]=h[n]"\n"$1}END{n=asorti(h,s);for(c=1;c<=n;c++)print s[c]":"h[s[c]]"\n=="}'
要数字排序需要把下标拿出来用 asort 函数,然后进行二次引用
.awk 跨行匹配,并用gsub替换返回匹配次数:
awk .text
.grep -A -B实现连续多行匹配:
seq |grep -A1 |grep -B1 ^
awk -vk1="abc" -vk2="efg" '{c++}$0~k1"$"{c++;getline n;if(match(n,"^"k2))print c-1":"$0"\n"c":"n}' filename
.关于 crontab 的星期和 月日的 and or 关系:
* * dosomething , 是每周一3点半执行是确信无疑的了。
* dosomething , 是当1号是周一的时候执行吗?不是!是1号,或者周一的时候执行。
crontab中的星期和日、月是一个“或”的概念,而非“和”的概念。
.awk、sed的缓冲问题:
man awk :fflush([file]) #awk 不是,与系统缓存与文件大小有关。
man sed :-u, --unbuffered #sed 是因为他是行缓冲方式,遇到换行就会输出。
.sed N P D 的解释:
首先;你加了-n参数,不会默认输出pattern space里的内容,只有p或者P操作才会打印,你先清楚这点.
当第一行的时候,N读取下一行,注意这时候的行号已经是2了,PS里的内容是 \n2;
因为不是第4行,所以不执行{ } 里的操作,执行完毕,因为-n参数不会输出PS里的内容.
这时候继续执行,已经是第三行了,因为第二行读走了,N操作,PS里的内容是3\n4,这时候行号是4,
满足4{P;D}条件,执行P,请查阅sed资料,P是打印PS里第一行的内容,那就是3输出到了屏幕.
.cp mv rm,默认都是不提示,加-i才提示,这三个命令的-f参数都不一样,好好看看。
::#tp#~> rm -f addsf
::#tp#~> rm -f addsf
::#tp#~> rm addsf
rm: 无法删除"addsf": 没有那个文件或目录
::#tp#~> rm -i addsf
rm: 无法删除"addsf": 没有那个文件或目录
::#tp#~>
rm -f是不提示不存在的文件,rm 默认就是不提示是否删除,加上-i才是提示是否删除
.awk的精度问题:
awk 'BEGIN{print OFMT;print 1335533180.170077-1335533180.169424;OFMT="%f";print OFMT;print 1335533180.170077-1335533180.169424}'
%.6g
0.000653028
%f
0.000653
.head 和 tail 的正负数既可表示开头也可表示取到结尾xx处:
head -c - # 除去一个文件的最后两个字节,也可以 dd 或者 sed '$s/..$//'
.查看文件以回车换行结尾:set fileformat 或者 xxd
换行符 \n ^j 0a LF
回车符 \r ^M 0d CR
如果是mac,用回车做换行符,那么你直接cat是看不到换行的。
.awk 索引index asorti 是按字典排序,因此如果数字的话以对齐位数后再排序:
a[sprintf("%03d",$n)]
.curl -G 模拟 post/get 请求(默认是 post 方式),--data-urlencode 进行 urlencode 编码
curl -v -L -G --data-urlencode '我们' http://www.baidu.com/s
curl -v -L -G -d "lat=41.225&lon=-73.1" http://localhost:5000/pulse # by default, calls POST. If you want to send a GET request,use -G
.urlencode 编码的其它几种方式:
echo '手机' | tr -d '\n' | xxd -plain | sed 's/\(..\)/%\1/g' # 这里用到了 xxd,python的话有API可以直接调用
.urldecode 编码解码:
printf $(echo -n "http://www.baidu.com/s?wd=%ca%d6%bb%fa" | sed 's/\\/\\\\/g;s/\(%\)\([0-9a-fA-F][0-9a-fA-F]\)/\\x\2/g')"\n"
.stat 查看数字权限:
stat -c %a
.gzip 查看文件压缩完成时间:缺省情况下gzip会保留源文件的时间戳, 所以是查不到你想要的完成时间的
ls -lctr yourfile.gz 或者 gzip -c foo > foo.gz
.cat -v 编码:
::#tp#~> echo 中|xxd
: e4b8 ad0a ....
::#tp#~> echo 中|cat -A
M-dM-8M--$
::#tp#~>
d的十六进制是64,8的十六进制是38,-的十六进制是2d
V的十六进制是56,P的十六进制是50。
其实就是系统的一种对应关系,中文在ascii里面没有,所以就这样表示了
.man的相关用法:
man crontab # 关于 crontab 的日期介绍
man不只是有1个,有1-。man -a crontab 就查全部 man 文档了. man -f crontab,看有哪些帮助文档
man -a crontab,会一个一个man看过去,你按q以后进入下一个man # man man
.rsync复制原理:
rsync 会在命令运行的初始阶段产生一个hash列表,里面列出所有要同步的文件和目录。 如果文件的大小在复制后有改变,
那么rsync 会尝试重新复制,几次尝试后,如果还是不一致,就会报个错。
.test -n/[ -n ] 问题:
在[ ]中, 如果只有一个参数, 那这个参数就被当成一个普通的字符串,并用 -n 测试其长度,
比如, [ -gt ], 相当于 [ -n -gt ],因此注意下面两者区别:
[ -n "" ];echo $? ; [ -n ];echo $?
.SIGNKILL() 和 SIGNTERM() 的区别在于:
SIGNKILL() 的效果是立即杀死进程. 该信号不能被阻塞, 处理和忽略。
SIGNTERM() 的效果是正常退出进程,退出前可以被阻塞或回调处理。并且它是Linux缺省的程序中断信号。
.sort排序会用到临时文件:默认 tmp 空间不足会报错:
sort: write failed: /tmp/xxxxx: No space left on device
linux的指定 -T 参数修改目录或者修改 TMPDIR变量
.printf ascii 与数字转换:
echo "7249 81"|awk '{printf "%c %c\n",$1,$2}' # 为什么结果一样?
echo "7249 81"|awk '{printf "%x %x\n",$1,$2}'
1c51 # 高位被丢弃了
echo "7249 81" | awk '{printf "%d %d\n",$1%256,$2}'
echo '7249%128'|bc
.显示shell开启了哪些shell标志:
$- The current shell flags, such as -x and -v.
- Expands to the current option flags as specified upon invocation, by the set builtin command,
or those set by the shell itself (such as the -i option).
set [+abefhkmnptuvxBCEHPT] [+o option] [arg ...]
echo $- && set -x && echo $- && set +x && echo $-
.top获取指定id的进程信息,-b 避免输出控制字符:
top -p -n -b|cat -A
.巧用gsub查找单词出现的次数:awk '{print $1,gsub("id","")}'
.脚本手动执行正常,crontab 无法执行:
由于 crontab 不加载 profile, bashrc之类的环境变量,而这其中受的影响很大比例都是PATH变量
所以养成好习惯:每个脚本之前就加上加载用户环境变量文件
.chattr 设置权限防止root删除:
-rw-rw-rw- root root May : .my_history
gs_chatlog_2_207:/data # chmod .my_history
chmod: changing permissions of `.my_history': Operation not permitted
gs_chatlog_2_207:/data # whoami
root
gs_chatlog_2_207:/data #
lsattr .my_history
-----a------- .my_history
解除-a限制:chattr -a 文件名
.awk或perl利用时间戳获取上一天日期:
perl -e 'use POSIX;print strftime("%Y%m%d",localtime(time-86400))'
awk -vnum=- 'BEGIN{print strftime("%Y%m%d",systime()+86400*num)}'
.删除所有的空文件:
find . -maxdepth -size 0c -delete
find . -maxdepth -empty -delete
.vim可以编辑 tar.gz, tgz, zip 等压缩文件:
vim some-archive.tar.gz
.临时忽略 SSH host key:
ssh -o UserKnownHostsFile=/dev/null -o StrictHostKeyChecking=no username@host
When you SSH to a server whose host key does not match the one stored in your local machine's known_hosts file,
you'll get a error like " WARNING: REMOTE HOST IDENTIFICATION HAS CHANGED!" that indicates a key mismatch.
If you know the key has legitimately changed (like the server was reinstalled),
a permanent solution is to remove the stored key for that server in known_hosts.
.找出页面的最后修改时间:
wget -S --spider http://osswin.sourceforge.net/ 2>&1 | grep Mod
Last-Modified: Wed, Feb :: GMT
或者用 curl 替代:
curl --head -s http://osswin.sourceforge.net | grep Mod
.先把整个文件的内容都显示出来然后再跟踪显示:tail -n+ -f
.find -L 查找链接对应目录:
链接 /usr/local/my_lib -> /usr/lib/
find -L /usr/local/my_lib -name "*so"
.关于 rsync 的服务端与客户端:
1.1.1.1:/tmp是走的ssh
1.1.1.1::/tmp和rsync://1.1.1.1/tmp是rsync服务端
但是很多配置是ssh不支持的,而且这样你要开帐号,还要开ssh的帐号
否则直接虚拟帐号,比如debian啊什么的,开的rsync,难道把ssh帐号给你?
走ssh的话其实就是scp的升级版,少点数据传输。
rsync daemon 的话在 daemon 上控制权限,要开 daemon,ssh 的话 ssh 控制权限,要开ssh
.回车与换行符的终端输出:
^J \n 0A 换行符
^M \r 0D 回车符
.BREs, EREs是否支持\s(PREs)和sed是否支持\s没有必然联系, 没规定软件不能扩展自己的匹配方法。
.获取文件的绝对路径:realpath filename # 也可以 pwd + "/" + filename
.tar.gz 不能直接 -r, 要先解压成 tar,再-r,最后再压缩成 tar.gz
.vim 列模式:
将光标放在需要选择列的第一个字符上,在一般模式中,按下“Ctrl+v”,
然后使用“↓”或“↑”进行块字符的选择,选中的地方会反白显示,
可以使用使用“y”进行复制,“p”进行粘贴,“d”进行删除操作。
或者:
Ctrl-V 选块,然后shift-i,shift-a或者c,x进行改写操作。双击 Esc 退出确认生效。
.read读取标准输入的问题:
while : # 此时 while循环里的块 FD0 已经被 <filename.txt 覆盖,类似局部变量优于全局变量
read # read要读入标准输入可以 read 或者 read var </dev/tty
done < filename.txt
.tcpdump -s0 不限制包长度 抓包:
tcpdump -s0 -w a.pcap host ,然后a.pcap传到本地,用wireshark打开。# wireshark 可以认为是 tcpdump的图形界面
.覆盖文件需要对文件有w权限,删除需要对文件所在目录有w权限,而不需要对文件有w权限:
一个目录里面有多少文件都是记录在目录项里的。只要让这个目录不包含某个文件,就相当于删除这个文件了。
所以删文件的实质是:使其所在的目录不再包含这个文件。所以对目录有写权限就行了。
.巧用 !* 匹配单词边界,实现单词字符分割:
sed 's/!*/ /g' <<< 'ab1c2pha' # 非任意字符,即为单词边界,等价于 sed 's/\B/ /g' <<< 'ab1c2pha'
echo "ab1c2pha" |sed 's/./& /g' # sed 's/\w/& /g'
awk -vFS="" '{$1=$1}1' <<< ab1c2pha
.用printf输出一行终端字符:
printf "%$(tput cols)s\n"|tr ' ' '='
.查看某个进程加载的环境变量信息:
tr \\ \\n </proc/$pidxxxxx/environ
或者如果 unix、freebsd 没有 environ,那就试试下面的:
cmdpid=`pidof cmd` && ps eww -p $cmdpid
.grep -l 实现打印匹配字符串的文件名,匹配并立即退出下一个,awk 的 exit 或者 nextfile 也可以实现。
.将多行变成一行的几种方法:
tr、xargs -n1、awk NF+= ORS=" "、echo $(<file) # paste -s 或者 column 也行
.每两行合并为一行:
sed '$!N;s/\n/ /' urfile
awk '{printf (NR%2)?$0 FS:$0"\n"}' urfile
paste -s -d ' \n' urfile # -d 后面的分隔符是个 list
xargs -n2 < infile
.shell下的8进制转码问题:
::#tp#~> echo $'\270\264\274\376'
复件
::#tp#~>
这个也可以,我现在把终端编码换到gbk了,就不用iconv了
::#tp#~> awk
复件
::#tp#~> # 直接 echo转不了,这里awk把\\264转换成汉字 ,iconv是转换编码
echo -e '\0270\0264\0274\0376'也可以
不过还是echo $'\270\264\274\376'方便,不然还要每个\都加个0。# echo $'' 相当于 echo -e ''
按理说八进制都0开头确实比较好 不过现在好多都可以去掉0 不懂为什么这么不和谐。
bash 了。
其实 python -c 'print "\270\264\274\376"' 也行。
.xargs -d 支持分隔符:
echo "abc,dd,bach,dong,jing,shang,china,bejing" | xargs -d, -n1
.关于rsync相同文件后 du 大小不一样的问题:
不一样大小很正常,因为文件系统的block不一样,或者文件系统底层用了压缩什么的。
因为du是块大小,ls是文件的实际大小,系统的块大小一般为4KB,
所以du的文件一般比ls的结果要大,而且系统块大小可以更改。
.查看系统块大小:
tune2fs -l /dev/sda1 | grep Block
.vi -u NONE -N 打开超大文件:
关掉所有vim插件,用非兼容模式打开,否则语法分析等操作很占资源的
.shell整数运算支持自增运算:
((s+=++i)) 相当于 i=$(($i+)) && s=$(($s+$i))
.ssh 会截获标准输入, 例如当while里套 ssh的时候,while 读了一个值之后,ssh会读取剩下的数据,
可以 echo ""|ssh 或者 ssh -n 也可以避免
.find|xargs 文件名包含了单引号: xargs: unmatched single quote
find -regex .... -printf %h\\n
find ...| grep ..| xargs -d '\n' -I {} dirname {}
find ... -print0| grep ...| xargs -0I {} dirname {}
.用 dd 快速创建一个指定大小的空洞文件(4G压缩后只有4M):
dd count=
.一个网段内,遍历哪些 ip 被占用可:
nmap -v -sP |grep "up"|awk '{print $2}'
.如何清理操作及登录日志记录:
> /var/log/lastlog
> /var/log/wtmp
> /var/log/auth.log
> /var/log/messages
> ~/.bash_history
> ~/.viminfo # grep cmd ~/*
kill -9 $$
1610.echo 转义输出 16 进制ascii的字符形式:echo -e "\x42"
1611.把一组 16 进制转换为ascii:
n=54542D4632352D44362D5345
echo $n | sed 's/\(..\)/\\\\x\1/g' | xargs echo -e
1612.利用bash扩展列出所有目录:ls ${PATH//:/ } #第一个//表示全局替换
1613.如何踢掉指定终端 tty/pts:
pkill -t,根据tty杀也可以或者 pts,pkill -t pts/1 #-9 强制,-15 正常结束
1614.如何禁掉外网网卡:
ifdown eth0
cd /etc/sysconfig/network/
vim ifcfg-eth0
#IP Config information for eth0:
#IPADDR='113.108.1.9'
NETMASK='255.255.255.128'
STARTMODE='off'
GATEWAY='113.1.1.1'
1615.把10000个文件切割成 100*100:
find /root -name "*.*" -type f|split -l 100 -100a2 # -da2 用数字做后缀,限制两位,-a 默认就是两位,split -dl 100 也行
1616.man 重定向到文件出现退格符 ^H的解决办法:col -b
1617.建立临时文件的方法:直接mktemp就行了,随机+判断文件是否存在,-u、--suffix、--tmpdir、XXX 或者直接 $$
1618.产生 a-z 的字母序列:
echo {a..z} | awk 'NF=5' #利用 bash 扩展
awk 'BEGIN{for(i=97;i<101;i++)printf("%c ", i);printf("%c\n", i)}' #利用 ascii
1619.删除包含空格或tab的空行:
grep -v -E "^[[:blank:]]*$" 或者 sed '/^\s*$/d'
1620.利用 split 返回数组长度判断字符串出现的位置:替换x~y之间,出现 abc 的字符串为 _XYZ_
echo 1abc56abc01abc5678abc|awk -vn=6 '{print gensub("abc","_XYZ_",split(substr($0,1,n+10),a,"abc")-1,$0)}' #有bug
echo 1abc56abc01abc5678abc|awk '{n=6;start=substr($0,1,n-1);mid=substr($0,n,n+10);end=substr($0,n+11);gsub("abc","xyz",mid);print start""mid""end}'
1621.screen的妙用:在SSH断开的情况下,服务器端继续执行程序,甚至从公司回到家里,你都可以还原你的linux会话状态。
screen -S test #创建一个名为test的screen任务
#输入要执行的命令,enter
#Ctrl + a + d保存screen
screen -ls #查看所有screen
screen -r test #恢复screen
exit #退出screen
1622.crontab语法详解:
crontab [-u 用户名] [-elr]
#crontab -e
# 分 时 日 月 周 [用户] command
# 每分钟执行一次第一个参数可以写成样 1-59 或者
# .---------------- minute ( - )
# | .------------- hour ( - )
# | | .---------- day of month ( - )
# | | | .------- month ( - ) OR jan,feb,mar,apr ...
# | | | | .---- day of week ( - ) (Sunday= or ) OR sun,mon,tue,wed,thu,fri,sat
# | | | | |
# * * * * * command to be executed
.设置开机启动:
vi /etc/rc.d/rc.local
.带有颜色的echo:
设置颜色的格式: \e[背景色;前景色;高亮m\e[0m
\e或\
背景色: 透明(使用终端颜色), 黑, 红, 绿, 黄, 蓝 紫, 青绿, 47白(灰)
前景色: 黑 红, 绿, 黄, 蓝, 紫, 青绿, 白(灰)
高亮:高亮是1,不高亮是0。(m后面紧跟字符串)
.while read 读取多个文件需要定义多个FD:
while read -u3 a && read -u4 b;
do
echo $a=$b;
done <<<<<<"$(seq 4 9)"
.awk 重组域替换行中的多个连续空格为一个:awk '$1=$1'
.linux关机:
shutdown -y -i5 -g0
sync;sync;init
poweroff
.kill 默认信号是 - SIGTERM ,我们可以自定义进行捕获信号:
while sleep 0.1
do
trap # bash a.sh & ; kill $!
done
.获取命令名及时间:
ps -eo time,cmd|awk -F: '/pad_/{print $2}'
ps ao time,cmd|awk -F: '/firefox/{print $1}' #注意用了a 就不需要 - 了
.16进制加法:
A='0x12345678' && A=$(awk 'BEGIN{printf("%x",'$A'+7)}') && echo $A
A= && echo "obase=16;ibase=16;$A+7"|bc && echo $A
.让进程在后台可靠运行的几种方法: nohup/setsid/&/disown/screen
disown是bash内部命令,nohup是外部命令
disown跟bg,fg一样是针对job进行操作,nohup是针对命令操作
disown -h 和nohup一样,在退出bash后,把进程的控制权都交给init
我们可以根据不同的场景来选择不同的方案。nohup/setsid 无疑是临时需要时最方便的方法,
disown 能帮助我们来事后补救当前已经在运行了的作业,而 screen 则是在大批量操作时不二的选择了。
.disown设置后台任务的方法:
用disown -h jobspec 来使某个作业忽略HUP信号。
用disown -ah 来使所有的作业都忽略HUP信号。
用disown -rh 来使正在运行的作业忽略HUP信号。
当使用过 disown 之后,会将把目标作业从作业列表中移除,
我们将不能再使用jobs来查看它,但是依然能够用ps -ef查找到它。
如果并没有把当前命令作为作业来运行,如何才能得到它的作业号呢?
答案就是用 CTRL-z(按住Ctrl键的同时按住z键)了!
CTRL-z 的用途就是将当前进程挂起(Suspend),然后我们就可以用jobs命令来查询它的作业号,
再用bg jobspec 来将它放入后台并继续运行。需要注意的是,如果挂起会影响当前进程的运行结果,请慎用此方法。
.screen设置后台任务的方法:
如果有大量这种命令需要在稳定的后台里运行,如何避免对每条命令都做这样的操作呢?
此时最方便的方法就是 screen 了。简单的说,screen 提供了 ANSI/VT100 的终端模拟器,
使它能够在一个真实终端下运行多个全屏的伪终端。
用screen -dmS session name 来建立一个处于断开模式下的会话(并指定其会话名)。
用screen -list 来列出所有会话。
用screen -r session name 来重新连接指定会话。
用快捷键CTRL-a d 来暂时断开当前会话。
.zip、tar中文乱码问题:
zip格式里面不包含编码的,7zip和rar包含的
所以gmail给附件打包的时候,如果文件名有中文,会提示你用什么编码。
zip包里面乱码是zip的问题,zip的文件名乱码是zmoden没转换
tar也是这样的,里面不包含编码
rar里面带了编码,zip没带 ,要改zip的源码,这样就可以了,不过两边都要改。
. 放在后台的程序,退出终端在登陆 jobs 就看不到了:
jobs当然看不到了,jobs是针对当前shell进程的,你退出了,当然没了,不过进程还在。
父进程变成init了,这和 $! 获取最后一个后台进程 PID 一样的道理,都是针对当前 shell。
.read计算回车符:
read也可以不用\n,-n限制字符数,或者用-N,连\n也算一个字符
.sed显示当前行号:sed -n '/hello/=' urfile
.获取 分钟以前的时间:
date -d "-5min" "+%s"
.文件名中带有感叹号:可以禁用历史扩展:set +H
echo mv "$i" ${i%%.*}.txt
.利用 od -c 的命令行模式观察输入内容的 ascii:
od -c #回车
输入你的内容 #回车
ctrl+D #输入结束,观察一下
.awk --non-decimal-data 做16进制或8进制加减:
echo "0xFFFFFFFF,0x50004000,0x34"|awk -F, --non-decimal-data '{printf("0x%x, 0x%x\n", $1, $2 + $3)}'
.tcpdump抓包没法看见IP:tcpdump -n -nn
:: > 172.23.9.123.mysql
.使用top监视所有匹配了foo字符的进程:
top '-p' $(pgrep -d ' -p ' foo)
top $(pgrep foo | sed 's|^|-p |g')
.给定字符,随机不重复:
tr -dc 'abcde12345' </dev/urandom |head -c5
awk -F '' 'BEGIN{srand();for(i=1;i<=5;i++)a[i]=int(rand()*100%10+1)}{for(i=1;i<=5;i++)printf $a[i];printf RS}' file
echo abcde12345 | perl -ne 'print(((split("",$_))[sort({rand>.5} (0..9))])[0..5])'
echo "a b c d e 1 2 3 4 5"| awk '{srand();for(i=1;i<=6;i++) {k=int(rand()*10)%(11-i)+1; a[i]=$k; $k=""; $0=$0}; for(i in a) printf(a[i]) }'
.date中不用 @ 转换时间戳:
date -d
.curl 获取外网ip:
curl ifconfig.me/all
curl http://iframe.ip138.com/city.asp 2>/dev/null|sed -n 's#.*<center>\|</center>.*##gp'
主:如果用正则的反向引用需要注意终端编码。
.巧用通配符重命名单个数字文件:
$i; done
.seq和printf输出指定宽度的数字:
seq -f
printf ..}
.设置linux终端窗口的标题文字:
PROMPT_COMMAND="echo -ne '\033]0;$title\007'"
.inode用完导致的磁盘空间不够:
dumpe2fs -h /dev/hda6 | grep node #查看inode总数及inode大小,inode是在分区的时候建立的
tune2fs -l /dev/DEVICE | grep -i inode #查看inode总数及inode大小,要调整总数需要重新格式化
df -i #查看各分区的inode使用情况
.awk判断ip公有还是私有:
echo $IP | awk -F'.' '{
== || ($==&&$>=&&$<=) || ($==&&$==)) p=;
;
print $ "\t" p;
}'
echo $|awk -F"[^0-9]" 'NF==4&&$1<256&&$2<256&&$3<256&&$4<256{
==||$==&&$==||$==&&$>&&$<)print
}'
.awk mktime( 的问题:
$ export TZ=UTC
$ awk
$ export TZ=UTC8
$ awk
$ export TZ=UTC-
$ awk
.安装libgcc_s.so.1出现错误Error: Protected multilib versions:
可以模糊安装试试:yum install libgcc*
.为什么访问不同的网站,公网ip是不一样的:
访问不同的地址,isp会选择不同的线路,他们每条线路出口都是nat转换的,所以看起来ip会是在任意地方的。
小运营商都这么搞,叫“穿透接入”
.sed从第n个字符开始全局替换:ng
echo aaaaa|sed 's/a/b/2g'
.touch 不改变文件时间:
touch -r oldfile newfile
.tar自动识别后缀:
高版本的话,直接 tar axf,自动识别类型,不用管扩展名了
.当同时有标准输出和文件名的时候,很多命令都是以文件名为优先的: 例如cat或者sort:
seq |cat a
.巧用sort+uniq进行按列去重:
echo #按第一列去重
.export 格式化列出所有环境变量:export -p
.获取 ls -lrt 的最后一列:
ls - 会将 ls -l 的长格式的最后一列打印出来,等价于 ls|xargs -
.用 nc 与给定的主机端口进行一次 tcp 握手:
nc -zvw host port
.以另一用户身份运行一个命令:
runuser -l userNameHere -c 'command' # runuser -l nginx -c 'ulimit -SHa'
su - root -c "command" # su - oracle -c 'ulimit -aHS'
.从匹配的下一行开始打印,直至结束:
awk '/xyz/{tag=1;next}tag' file # 第一次匹配至文件尾
awk -vRS="[a-z]*xyz[a-z]*" 'END{print $0}' data # 巧用 RS + END 打印最后一段匹配的
.xargs 处理带空格或特殊字符的文件:print0 | xargs -
-i {}对空白字符做了特殊处理,但是其它特殊字符还是不行的,试试touch "a'b"
.shell ! 扩展通配符排除某个文件:
shopt -s extglob然后cp /!(glo.txt) /这样也行
.在历史记录里查询某个命令打印它,而不是执行它:
!<command>:p
.输出特定长度的随机数字:
awk 'BEGIN{srand();a=rand()*100000000;printf("%08d\n",a)}'
.语言字符环境设置:
export LC_ALL=en_US.UTF-
export LANG=en_US.UTF-
export LC_CTYPE=en_US.UTF-
.sed -e{} 固定行范围扩展:
sed -e{,}{,}'s/\S\+ *//3' #删除第1、4行的第3个域,注意前面的{,}
.中文与十六进制互换:
echo -n "中"|xxd -ps
反过来从0xd6d0得到汉字:echo -e "\xd6\xd0" #0xd6d0 该结果与终端编码有关,类似 urlencode、urldecode
.awk --source进行外部函数调用:
seq |awk -f func_awk -W source '{print;echo_hello()}' #假设func_awk 是一个文件,里面定义了一个名为 echo_hello 的函数。
.tar 利用标准输出配合 gzip 创建压缩文件:
tar cvf - "$folder" |gzip > /new_folder/$folder.tar.gz # - 相当于文件占位符
.中文转16进制:
echo -n 我 | iconv -t utf-16le | hexdump -e '"%d"'
.打印当前目录以及所有父目录的权限:
namei -m $(pwd)
.单词边界与空串的区别:
echo 次
echo "abcde 1?2 *f"|sed 's/\B/ /g' #单词边界
.理解正则中的“单词边界与非单词边界”:
aba 的单词边界为:\ba\Bb\Ba\b
\b 为单词边界 echo "fabcfde 1?2 *f"|grep --color '\bf'
\B 为非单词边界 echo "fabcfde 1?2 *f"|grep --color '\Bf'
.shell扩展通配 extglob 排除文件:
shopt -s extglob; cp aaa/!(*) bbb; shopt -u extglob
.tar中不能压缩 -z 和追加 -r 混用,-r 只能用在打包中:
line : Aborted (core dumped) tar -zrvf $ip.tgz ${ip}_${ssn}.sql
gunzip a.tgz -c|tar rf - b|gzip >b.tgz #试过了,也不行,因为-r和-f -不兼容
.双机信任中,拷贝公钥到远端机器:
ssh-copy-id -i .ssh/id_rsa.pub user<a href="http://my.oschina.net/server" target="_blank" rel="nofollow">@server</a>
.sort -h 按人类易读的字节大小排序:
find . -type f -print0 | xargs - du -h | sort -hr | head - #递归找出10个当前目录下最大的文件
.你可以 ls -l /proc/pid/fdinfo/ ,观察那个文件读到哪了 # cat /proc/XXXX/fdinfo/Y
.xargs 的行列合并:直接xargs为合并,xargs -n1 为拆分:
echo a b d e b f a c e d | xargs -n1 | sort -u | xargs
.ping快速检测主机存活:
ping -c1 -W 8.8.8.8 # -c次数 -W超时时间
.windows管理命令:msinfo32; systeminfo; control; gpedit.msc; msconfig; services.msc
.awk4. 在asorti中对下标索引按数字排序: asorti(a,b,"@ind_num_asc")
.rsync只有源和目的,没本地和远程,你可以本地到本地,也可以远程到远程。
加了 -delete 之后,不是增量同步了(默认),而是镜像同步,会将 dest 上的多余文件删掉。
.cut -d 不支持多字符分隔符(如 \t)的问题:
echo -e "1\t2"|cut -d\t -s -f2 #注意此处的 \t 相当于t,-s的作用相当于sed -n,防止不匹配的时候全文输出
cut默认就是制表符 \t,就像 echo 不支持 \t 要 -e 才行
或者 \t用 CTRL+V+TAB ;CTRL+V +I 代替
.获取管道里各个命令的执行状态:PIPESTATUS 数组
.Gnu Sed 定址匹配的几点说明:
. GNU 恰巧有许多对 POSIX sed 标准便利、省时的扩展。另外,GNU 没有 sed 早期专门版本的很多限制,如行长度限制 -- GNU 可以轻松处理任意长度的行.
. first~step GNU扩展,选定 起始行~步长 的那些行。例如选择所有奇数行1~;选择从第2行开始的,每隔3行 ‘~'
. /regexp/I 和 \%regexp%I : GNU扩展,忽略大小写.
. ,/regexp/ : 这是唯一一个使用0作为行号不会报错的用法,一般情况下不存在”第0行”,在任何其他命令中使用0作地址都会报错.
. addr1,+N 匹配addr1和它后边的N行
. addr1,~N 匹配addr1和它后边的行,直到输入的下一行的行号是N的倍数
例如:seq |sed -n '2,~3p' #从2开始到第一个能被3整除的行为止
.<(cmds) 是bash进程替代(Process Substitution), 如果理解什么是命名管道,
那么<(...)就是一个临时的命名管道,如果不理解,
可以简单的看作bash产生一个/dev/fdxxx的文件, 文件内容是cmds的标准输出
.关于 sh 软链接 bash 的问题:虽然 sh 链接了 bash,但单独执行他们仍可能不一样的结果:
bash可以根据自己被 exec() 时的参数调整自己的行为, 你叫它sh它就按sh的规则玩, 你叫它bash它就按bash的规则玩,
*nix系统里这样的例子太多了, 多个工具指向同一个文件, 按名字产生不同的结果
.找出所有可写的文件:find / -writable >/dev/null
.结束指定端口的进程:
fuser -kn tcp
lsof -i: |awk '{print $2}' |sort -u |xargs kill
.csplit:根据匹配的指定内容,按行分割文件,split可以按行数或者文件大小分割文件:
csplit a /d/ {*}
awk '/d66/{i++} {print > "file" i}' infile
.nc代替telnet扫描端口:
nc -z -w -u # 成功会显示信息,不成功没有,可以返回值判断
-z表示检测或者扫描端口 -w表示超时时间 -u表示使用UDP协议
.find -empty可以找出空目录,-size 0不行,-exec后面肯定要用\;或者+来执行方式的
find -print0|xargs -,这两个参数就是互相配合的
如果你不理解+和;的区别,最好还是用xargs,而且xargs还能限制命令行长度,参数个数,比exec的+和;强大多了
; 一个是每个参数执行一次,cmd arg1;cmd arg2;ls|xargs -I{} echo {} 或者 xargs -n1
+ 是所有参数执行一次,cmd arg1 agr2;ls|xargs echo
.(())算术扩展的类eval应用:
a=;b=
?$i=:$i )) ; done
; done
.tcpdump匹配http头:
tcpdump -XvvennSs -i eth0 tcp[:]=:]=0x4854
0x4745 为"GET"前两个字母"GE"
0x4854 为"HTTP"前两个字母"HT"
.php-fpm 重载配置方法(解决新版不带reload/stop)
php从5.3就可以集成php-fpm,但是集成后的php-fpm去掉了sbin/php-fpm (start|stop|reload)这些命令,只能启动。
可以使用信号量,下pid为进程"php-fpm: master process"的pid
重载进程和配置文件:kill -USR2 pid
退出进程:kill -QUIT pid
立即停止:kill -INT pid
.大量连接处于 TIME_WAIT 状态的解决方法:
netstat -nt 看到大量 TIME_WAIT
dmesg 看到 time wait bucket table overflow
解决办法:、 /proc/sys/net/ipv4/tcp_max_tw_buckets 过小了,设成540000以上
、 /sys/module/ip_conntrack/parameters/hashsize 过小了,
设成/proc/sys/net/ipv4/netfilter/ip_conntrack_count这个值的1/4大小较为合适
.编译php出错:error : cannot open shared object:
ln -s /usr/local/mysql/lib/libmysqlclient.so. /usr/lib/
照做后仍然报错,原因是该方法适用于32位系统,64位系统应使用下面的这行
ln -s /usr/local/mysql/lib/libmysqlclient.so. /usr/lib64/
另外:在编译的时候,不写mysql的路径,而使用mysqld代替,也可解决该问题的出现。
.shell打印当前行号:
echo "$LINENO"
显示函数在哪一行被调用的:
line(){
echo call by line `caller | awk '{print$1}'`
}
line
.当系统swap空间所剩不多时,可通过在本地磁盘上创建普通文件作为swap :
dd一个文件,然后mkswap,然后swapon
dd
mkswap ./swapfile
swapon ./swapfile
即可为系统临时增加1G的swap。
使用完毕后执行:
swapoff ./swapfile
rm -f swapfile
.多行结果赋值给变量:用引号防止 shell 做 word split:
file=`find . -name "*"`
echo "$file"
.wireshark 八进制编码问题:
google.com/search?q=淘宝网 这个http请求,抓包里面对应的内容是
GET /search?q=\\\\\\ HTTP/1.1\r\n
\\\\\\370这一段对应的是淘宝网3个字,应该是gbk,gbk是每个汉子两个
\nnn the eight-bit character whose value is the octal value nnn (one to three digits)
8进制,转换成十六进制看看,再看编码
CC D4对应\\ echo :ccd4|xxd -r|iconv -f gbk -t utf-
echo $
前面要加$,这样是表示8进制的
.sort -n -g 按数字排序的区别:
-g 通用数值排序,-n 数值排序。
-g 支持的记数方法比 -n 广,-g 使用标准 C 函数 strtod 来转换数值,支持科学记数法,如 1.0e-34,
不过 -g 比 -n 慢得多。详细区别参考info sort文档或者stackoverflow.com。
.关于sort -h排序问题:
echo "2025K
1M
1G"|sort -h # du、ls、df 等能保证输出一定是k<m<g的格式,不会存在2025k这种形式的。
.使用 cURL 测试 Web 站点的响应时间:
curl -o /dev/null -s -w %{time_connect}:%{time_starttransfer}:%{time_total} http://www.canada.com
.设置用户的进程数限制:
/etc/security/limits.conf
/etc/profile里面写ulimit -n ,只有root才能增加,这样其它用户登录都会报错。
nofile 是打开文件数,nproc是进程数,soft 指的是当前系统生效的设置值。hard 表明系统中所能设定的最大值。
soft 的限制不能比hard 限制高。用 - 就表明同时设置了 soft 和 hard 的值
.ssh不输出连接信息:
ssh -t 会输出一个或者 ssh 加 -q 参数 或者 >/dev/null 屏蔽掉
.wget将页面内容输出到标准输出:
wget -qO- http://shushu.com.cn/tm.php # -qO- 相当于 -q -O -
.iptables端口转发:将本地80端口的请求转发到8080端口,当前主机ip为192.
iptables -t nat -A PREROUTING -d -j DNAT --to-destination
ssh 或者 haproxy 之类的也可以做端口映射
.进程间通信方式:
PIPE(FIFO)
消息队列
信号量(Semaphore)
共享存储
SOCKET
.线程间通信常用的三种方法:
.全局变量
进程中的线程间内存共享,这是比较常用的通信方式和交互方式。
注:定义全局变量时最好使用volatile来定义,以防编译器对此变量进行优化。
.Message消息机制(windows下)
常用的Message通信的接口主要有两个:PostMessage和PostThreadMessage线程常常要将数据传递给另外一个线程。
Worker线程可能需要告诉别人说它的工作完成了,GUI线程则可能需要交给Worker线程一件新的工作。
.CEvent对象(windows下)
CEvent为MFC中的一个对象,可以通过对CEvent的触发状态进行改变,从而实现线程间的通信和同步。
.本机免key登录:
ssh-keygen -t dsa -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
.curl抓取http返回码:
curl -so /dev/null -w '%{http_code}\n' www.sina.com
.ssh -D 一句话代理:
alias proxy='expect -c "spawn ssh -D 127.0.0.1:6789 67.205.5.88 -l username;expect *password* ;send -- \"password\r\" ; expect eof"'
alias proxy='expect -c "spawn ssh -D 127.0.0.1:6789 67.205.5.88 -l username;expect *password* ;send -- \"password\r\" ; interact"'
.ps -ww 不限制宽度输出:结果也与终端有关
::#tp#~> ps -few|wc -L
::#tp#~> ps -feww|wc -L
::#tp#~> echo $COLUMNS
./dev/null 被cp,权限被修改:
mknod -m /dev/ # 创建特殊文件的,比如block或者是管道文件
.每 n 个字符截断换行的几种方法:
echo |sed 's/..../&\n/g'
dd cbs= conv=unblock; fold -c4;grep -Eo '.{1,4}'
.awk输出到管道或者文件的时候有buffer,一般是4K,到达4K才输出,输出到标准输出没buffer
i=;while sleep 0.1;do echo -ne "\r"$((i++));done|awk 'BEGIN{ORS=RS="\r"}{print $0}'|tee a
可以用这个测试下,如果去掉tee就可以正常显示,或者去掉awk也可以,两个都加上就不行,
如果把sleep .1改成sleep 0.000001,到达4K的时候就会输出了,
用fflush()可以刷新buffer
.od进行ascii到八进制、10进制、16进制的转换:
printf "^A" | od -An -o # -b -x -d
.curl测试网络状况:
curl -so /dev/null -w '%{http_code}' -H host:www.host.com 8.8.8.8/a.txt #测返回码
curl -sH host:www.host.com 8.8.8.8/a.txt #下载文件测试
.paste -s串行合并文件内容:
seq |paste -sd ' \n' #每5个换行
echo {..}|xargs -n5 #xargs -n 效率比较低
echo {..}|grep -Po '(\w+ ?){5}'
.printf打印ascii的10进制值:
printf '%d\n' \'c # \'c 意思就是使用字符作为数字值
awk 打印 ascii 对应 进制值:
echo a|awk 'BEGIN{for(i=0;i<255;i++)a[sprintf("%c",i)]=i}{print a[$0]}'
打印ascii的16进制值:
printf '%02x' "'+" # echo -n '+' | od -tx1 -An | tr -d ' '
.- 表示标准输入或者标准输出,用法举例:
tar cvf - * | (cd /dest/dir && tar xvfp -) # - 需要程序自己支持,例如tar、cat,-可以理解为临时文件形式存在
-在命令符当中表示标准输入或者标准输出。
在tar cvf - *当中,表示标准输出,因为f参数后面跟的是输出的,
这个命令的意思就是把当前目录的所有文件,tar打包到标准输出当中
然后通过管道,这个命令的标准输出作为后面 (cd /dest/dir && tar xvfp -)
命令的标准输入,cd /dest/dir没有什么好说的,切换到那个目录。
然后tar xvfp表示解压缩文件,但是没有指明是那个具体的文件?所以就是-了,
表示标准输入当中获取文件,然后解压缩到当当前目录。
总体来看,这个命令就是拷贝文件了。
.sub()与match()的搭配使用,可逐次取出原字串中合乎指定條件的所有子字符串:
awk 'BEGIN {
data = "p12-P34 P56-p61"
-]+/) >) {
print substr(data,RSTART, RLENGTH)
sub(/[-]+/,"",data)
}
}' #类似python re中的group或者正则中的捕获组
.巧用find的内置命令:delete、ls等:
find -name "AAA" -ls #同时减少了-exec执行fork带来的开销。
find . -name AAA \( -type f -exec ls -l {} \; -o -type d -exec ls -ld {} \; \)
.显示所有 ipv4:
ip -o - a s
.printf -v 直接赋值变量:
printf -v
.awk FIELDWIDTHS 将字符串按指定域宽度划分:
echo '23456.23478.58924.6' | awk -vFIELDWIDTHS="3 6 5 5" -vOFS="\t" '{$1=$1;print}'
echo ${A::} ${A::} ${A::} ${A::}
.查看 tcp 连接中 keepalive 的数量:
netstat -town
.模拟骰子产生1~6的随机数:
echo $((0x$(head -c5 /dev/random|xxd -ps)%+))
.pkill杀进程是模糊匹配,小心误杀:
pkill aaa ,所有进程名里包含aaa的都会被干掉
你可以用pgrep看看,进程名,不包含参数,你还可以指定tty、用户名什么的
如果要精确匹配:pgrep -lx 类似 grep 的 -x 按行匹配
-f 是不仅仅在进程里面查,参数也会查 ,就是你pkill -f apache,会把java -u apache也杀掉。默认是只看进程名是否匹配
pgrep -fl
sleep
-fx 是完整匹配整个命令行(进程名+参数) ,-x 是完整匹配进程名
.pkill 踢出who里的登录终端或者ip:
pkill -kill -t pts/
.得到10个字符的随机密码:
tr -dc A-Za-z0-9_ < /dev/urandom | head -c | xargs
.perl列出当前目录下所有的符号链接:
perl -e 'print map { -l and $_ .= "\n" } <*>'
.nnohup退出终端会断掉:
shopt |grep huponexit
grep -iR hup .bashrc .profile /etc/bash* /etc/profile*找下,反正我这没有,我是off
默认值都是off的,开了就会出现他的那种问题,shell退出不应该给这个shell的子进程发HUP信号的,可以trap下。
.利用nc远程传输文件:
tar -cf - * | nc
.正则贪婪匹配陷阱:最左边的贪婪匹配优先级最高,后面的匹配都是基于正则的回溯机制,所以后面的都属于非贪婪匹配了。
*虽然贪婪,但也可能发空匹配,因为他可以为0,而+至少匹配一次,限制较强。
echo "房屋信息 房屋信息 1--district 190_360"|sed -r 's/(.*)([0-9]+)_([0-9]+)/=\1==\2===\3/'
=房屋信息 房屋信息 --district =====
echo "房屋信息 房屋信息 1--district 190_360"|sed -r 's/(.*)([0-9]*)_([0-9]*)/=\1==\2===\3/'
=房屋信息 房屋信息 --district =====
echo "房屋信息 房屋信息 1--district 190_360"|sed -r 's/(.+)([0-9]+)_([0-9]*)/=\1==\2===\3/'
=房屋信息 房屋信息 --district =====
echo "房屋信息 房屋信息 1--district 190_360"|sed -r 's/(.*) ([0-9]+)_([0-9]*)/=\1==\2===\3/'
=房屋信息 房屋信息 --district =====
.rsync -b 更新前先备份:
rsync -b,然后--suffix指定后缀或者--backup-dir指定备份的目录,mv肯定比cp快,rsync的-b也是mv的
.windows下查询域名对应的所有服务器:
nslookup -qt=mx web.qq.com
.vi一个远程文件:
vi scp://username@host//path/to/somefile #注意双斜线
.删除所有非打印字符:
tr -dc '[:print:]' < filename
.PS1 设置putty等ssh工具的标签页 title:
PS1='\u@\h:\w\$ '
# If this is an xterm set the title to user@host:dir
case "$TERM" in
xterm*|rxvt*)
PS1="\[\e]0;\u@\h: \w\a\]$PS1"
;;
*)
;;
esac
或者:
PROMPT_COMMAND='echo -ne "\033]0;${USER}@${HOSTNAME%%.*}:${PWD}"; echo -ne "\007"'
.tail -f 管道的buffer不能实时输出的问题:
unbuffer -p tail -f .sh_histoy |awk '{print $0}'
.利用 bc 计算器 obase 参数,实现十进制转二进制:
echo 'obase=2;98'|bc
.为 man 指定阅读器 pager :less,并搜索指定字符串
PAGER='less -iRsp034' man ascii
.vim中获取只读文件的sudo权限写入::w !sudo tee %
命令:w !{cmd},让 vim 执行一个外部命令{cmd},然后把当前缓冲区的内容从 stdin 传入。
tee 是一个把 stdin 保存到文件的小工具。
而 %,是vim当中一个只读寄存器的名字,总保存着当前编辑文件的文件路径。
所以执行这个命令,就相当于从vim外部修改了当前编辑的文件,然后从定向到当前文件。
%! sudo tee % > /dev/null
% #VI/VIM编辑的文件内容
! #管道
sudo #以root权限操作
tee #
% #VI/VIM编辑的文件
> /dev/null #这里可省略
.查看linux版本的几种方法:
cat /proc/version; uname -a; lsb_release -a; cat /etc/issue;
cat /etc/redhat-release; rpm -q redhat-release
file /bin/bash; file /bin/cat
.ls --time-style自定义时间格式显示:
ls -lth --time-style=+"%F %T"
.去除vi打开文件时带的颜色及控制乱码字符:col -b
.sh 虽然链接到了 /bin/bash,但是 /bin/sh 执行效果不完全等同 /bin/bash,而是 /bin/bash --posix
有很多系统里 gzip gunzip zcat 都指向一个inode, 同一程序对不同加载名作不同动作的用法在*nix中太常见了
.正则捕获示例:抓取网页上的 URL 链接:注意设置 LC_ALL 语言环境和字符集
curl -s www..com.cn | sed -rn "s#.*(http://[0-9A-Za-z]*\.[^/\"?' ]*).*#\1#p"|sort|uniq -c|sort -k1rn
curl -s www.qq.com | LC_ALL=C sed -rn "s#.*(http://\w*\.[[:alnum:].]*).*#\1#p"|sort|uniq -c|sort -k1rn
上面的 sed 有一行上不能匹配多个网址的 bug,因为sed需要完全匹配后才能print,下面用 grep 修复该问题
curl -s www.360buy.com | grep -Po '(https?://\w*\.[[:alnum:].]*)' |sort|uniq -c|sort -k1rn
注:posix 字符类 [[:alnum:]] 等价于 [-9A-Za-z],
\w 为 [[:alnum:]_]的同义词,指单词字符,相当于 [-9A-Za-z_],关于这点 man grep \w 中有前后矛盾的描述。
.sed单引号转义问题:
sed单引号转义只支持16进制 \x27, 而且外层一定要加单引号或者双引号引起来:
echo "1'1"|sed -r 's/\x27//' # 不加引号那shell 会解释\x 成为 x,所以要养成加引号的习惯
不支持8进制:echo "1'1"|sed -r 's/\047//' ,而 awk 是两者都支持的。
或者sed中用 "'" 表示单引号
.用 bc -l 加载数学库做小数计算:
echo /|bc -l # echo /|awk '{printf "%f", 2/70}'
.locale 字符集语言环境的设置:
echo http://wwAw.HA~12o.com|LC_ALL=C sed -rn "s#.*(http://([a-z]*)\.[^/\"?' ]*).*#\2#p"
echo Aab|LC_ALL=C sed -r 's/[A-Z]//g'
注:有时候莫名其妙的问题一般与 LC_ALL=C 有关,C 是 POSIX,和具体语言无关。
其实最好是C,这样sort排序会快很多,还有遇到[a-z]这种情况比较安全,还有 [.-/] 这种
.巧用 sed // 上次匹配功能排除边界值:
echo -e "a\n2\nc"|sed '/a/,/c/{//!d}' # // 相当于awk中 !/^a|^c/
.shell中转换16进制到10进制:
i=A; echo "obase=10;ibase=16;$i" | bc
a= b=e8; (( #a > #b ))&&echo "a > b"||echo 'a <= b'
echo $(printf "%d" 0xD)
.rsync 只同步目录(危险慎用!)
"只" 同步目录,子目录的子目录也可以同步,但子目录里的文件不同步。
rsync -av --delete -f '+ */' -f '- *' SRC/ DEST/ # -f '+ */'是同步目录,-f '- *'是不同步文件。
想把子目录的内容也同步:
rsync -av --delete -f '+ */' -f '- /*' SRC/ DEST/
.vim 粘贴板简介:
vim 有 12个粘贴板 、、、…、、a、"、+;用:reg命令可以查看各个粘贴板里的内容。
在vim中简单用y只是复制到 " (双引号)粘贴板里,p也这样。
Ny完成复制到N号剪贴板,其中N为粘贴板号(注意是按一下双引号然后按粘贴板号最后按y),
例如要把内容复制到粘贴板a,选中内容后按 "ay 就可以了,有两点需要说明一下:
+号粘贴板是系统粘贴板,用"+y将内容复制到该粘贴板后可以使用Ctrl+V将其粘贴到其他文档(如firefox、gedit)中,
同理,要把在其他地方用Ctrl+C或右键复制的内容复制到vim中,需要在正常模式下按 "+p,
要将vim某个粘贴板里的内容粘贴进来,需要退出编辑模式,在正常模式按"Np,其中N为粘贴板号,
如上所述,可以按"5p将5号粘贴板里的内容粘贴进来,也可以按"+p将系统全局粘贴板里的内容粘贴进来。
.查看本机外网 ip:
curl ifconfig.me
.awk 处理浮点数四舍五入的问题:
ieee754 http://zh.wikipedia.org/zh-cn/IEEE_754
$ echo "3.445"|awk '{printf "%0.2f\n",$0}'
3.44
There is no ieee754 number for 3.445000000000000000000...
$ echo "3.445"|awk '{printf "%0.20f\n",$0}'
3.44499999999999984013
$ echo "3.4450000000000001"|awk '{printf "%0.20f\n",$0}'
3.44500000000000028422
$ echo "3.44500000000000001"|awk '{printf "%0.20f\n",$0}'
3.44499999999999984013
.过滤掉 /etc/passwd 中的自动生成用户
awk -F: '$0!~/nologin/&&($3=0||$3>=500)' /etc/passwd
.利用taskset有效控制cpu资源
taskset -c sh job.sh #开启一个只用0标记的cpu核心的新进程(job.sh是你的工作脚本)
taskset -pc #查找现有的进程号,调整该进程cpu核心使用情况
可在top中进行负载check,最后你可以在你的工作脚本中加入该指令来合理利用现有的cpu资源
.关于 [^A-Za-z] 是否等价 [^A-z] 的问题:
[^a-zA-Z] 是正则
[!a-zA-Z] 是通配符
用的地方不一样,而且A-z包含几个非字母字符,且用的时候还需要注意字符集
.校对大量文件的完整性:
rsync 返回码或者 find打印大小,不要用du,du与FS的block大小设置有关,异构的FS中不准确
.登录linux,执行配置文件的顺序:
/etc/profile -> [~/.bash_profile | ~/.bash_login | ~/.profile] -> ~/.bashrc -> /etc/bashrc -> ~/.bash_logout
在登录时,首先会执行/etc/profile,其次是用户目录下的.bash_profile,.bash_profile不存在则读取.bash_login,
若.bash_profile和.bash_login都不存在,最后才读取.profile
.wget 带上浏览器 agent 下载:
wget -c $url -O test2.flv -U # --user-agent=AGENT
.ed 是真正的 inplace editing,sed 是假的 inplace editing,中间是生成了临时文件的。
.查看文件编码的 种方式:file -i 文件名 # vim 中 :set fileencoding
.根据进程名显示进程号: pidof java
.如何限制用户的最小密码长度:修改 /etc/login.defs 里面的PASS_MIN_LEN的值
.如何使新用户首次登陆后强制修改密码:useradd -p testuser
.vi 编辑标准输入输出:crontab -l | vi -
.awk 利用协同进程监听指定端口:
awk 'BEGIN{service="/inet/tcp/2000/0/0"; service |& getline; print $0; close(service)}'
. awk ‘FS=”:” {print $,$,$}’ 明显不等价于 awk -F: ‘{print $,$,$}’ ,
前者是读取第一行记录并将记录分割成字段之后才进行FS的设置,FS=”:” 作为了模式,通常这样的写法是错误的.
例如 awk 'FS=":" {print $1,$3,$6}' /etc/passwd 会把第一个整行打印出来
.awk gensub 删除字段及其FS:
echo |awk '{$4="";print gensub(FS,"",4)}'
echo |awk '{sub($4FS,"")}1'
echo "1 2 3 4 5"|awk '{$4="";$0=$0;$4=$4;print}'
注意 $=$;$=$ 缺一不可,否则会有残留FS输出,$=$ 在重构该域时会把周围多个 FS 合并,就像 echo 一样
.设置 PS1,根据上一个命令返回状态码控制显示红色还是绿色:
`[ $? -eq ]||echo \[\e[31m\]`
.判断程序输入来自文件还是标准输入:
用 < 的话也是来自 - 的,不是来自文件
::#tp#~> awk 'END{print FILENAME}' <a
-
::#tp#~> cat a|awk 'END{print FILENAME}'
-
::#tp#~>
.查看dd命令的执行进度:
dd # a 终端执行
; done # b 终端执行
然后就能看到间隔5秒一次的输出结果了,所执行的killall命令循环会在dd命令执行结束之后退出。
为什么dd命令的进度输出要killall命令来激发呢?其实答案很简单,dd的进度输出就是这么设计的,
再详细点就是dd命令在执行的时候接收到SIGUSR1信号的输出当前的读写进度,而killall命令在这里起的作用就是给dd进程发送这个信号。
对于没有那些不与终端交互的守护进程(Deamon Process),通常的设计是在接收到SIGHUP信号之后就会重新读取配置文件。比如下面的:
# 当你对smb.conf修改之后,运行下面的命令,修改就能生效了
# 而不用再来一个smb restart
killall -HUP smbd
.atime、ctime、mtime 区别与联系:
atime:访问时间(access time),指的是文件最后被读取的时间,可以使用touch命令更改为当前时间;
ctime:变更时间(change time),指的是文件属性最后被变更的时间,变更动作可以使chmod、chgrp、mv等等;
mtime:修改时间(modify time),指的是文件内容最后被修改的时间,修改动作可以使echo重定向、vi等等;
ctime 变动时不影响 mtime
mtime 变动时 ctime 一起变。
.bc中十进制、二进制互转,ibase影响你所有的输入,
::#tp#~> echo 'ibase=10;obase=2;11'|bc -l
::#tp#~> echo 'ibase=2;obase=10;11'|bc -l # 这里obase=10就是二进制
::#tp#~> echo 'ibase=2;obase=1010;11'|bc -l
::#tp#~> echo 'ibase=2;obase=10;11'|bc -l
::#tp#~> echo 'obase=10;ibase=2;11'|bc -l # ibase影响你所有的输入,换个位置就不一样了
::#tp#~>
.nginx 的 logRotation 机制:
mv access.log access.log.
kill -USR1 `cat master.nginx.pid` # 发信号让进程写 access.log,而不是 access.log. 老日志
sleep
gzip access.log. #
.linux 文件系统的一些限制:
一级子目录限制个数: (真正可以容纳的是31998个子目录,. 和 ..)
文件名字符长度 ,中文
文件个数:貌似没有限制
注:不同的文件系统可能限制不一样,修改 kernel include file 然后 recompile 可以修改限制
.关于 find 不管找到与否都返回 的问题:因为默认是 find -print
find -type f -name "
.管道是异步(并行)执行的:
::#tp#~> sleep |sleep &
[]
::#tp#~> ps -eo lstart,cmd|grep 'sleep 99'
Mon Mar :: sleep
Mon Mar :: sleep
Mon Mar :: grep --color=auto sleep
::#tp#~>
sleep 999和sleep 998是同时启动的,并不是sleep 999执行完成,再执行sleep 998的
管道前后的进程并发执行,不过这个还是会有一个时间差,这个看cpu的调度和负载。
正因为如此,ps -fe|grep grep 不一定会有结果,而 ps -fe|grep init 一定有结果
ps -fe|grep grep,可能是零个,也可能一个,不过大部分情况都是一个
ps -fe|grep init,可能是一个,也可能是两个,不过大部分情况都是两个
.管道其实在操作内存:
echo|ls -l /proc/self/fd/,结果里面的0 -> pipe:[]就是管道文件
或者ls -l /proc/self/fd/|cat,这样的话1是管道
如果没有管道的话,应该是/dev/pts/4什么的
self是你当前的pid,fd是这个进程的文件描述符, 是匿名管道的文件名
.强大的进程匹配工具 pgrep:可依据多个属性匹配指定的进程
如:pgrep -u root sshd
pgrep -fl bash 等价 ps -eo pid,cmd|grep [b]ash
.nc 测网卡带宽:
nc -l -p </dev/zero
nc >/dev/null
直接从/dev/zero读数据到1235端口,然后我的第二个nc从1235接手数据写到/dev/null,然后ifstat测试当前流量
全部走内存,没有磁盘io,可以用eth测试,但是eth有危险,万一把网卡堵死,命令都执行不了。
.当 FS 为单个空格时,无论 RS 是否被重新定义,FS 始终都是 [ \t\n]+
seq |awk '{$0=$0"\n#\n";print $1,$2}'
.注意大括号命令组的用法:大括号前后空格 和 每条命令分号结束,否则提示命令未结束
{ sleep ; continue; }
.lsof && test -s 检查文件写入完成,或者先写临时文件再 mv:
chkFileWriteOver(){
]]
do
((c++))
# , it's ok.
[[ -s $ ]] || { sleep ; continue; }
lsof $
# if file not locked, it's ok.
[[ $? -eq ]] && echo "---------- File is OK ..." && break
sleep
done
# here, if file is exception, you can send a email to somebody.
[[ $c -eq ]] && echo "---------- File is not exsit ..."
}
chkFileWriteOver fileName
.shell的解释和编译引起的性能问题:
..}; do str="$str $i"; done
# 这里是for慢,不是{..}慢,你echo {..}很快的
解析 1次循环0.001秒 10次循环0.01秒 1000次循环1秒
编译 1次循环0.001秒 10次循环0.002秒 1000次循环0.003秒
编译其实就是那个意思,并不是那个比例,解析的话几次就是几倍
可以认为编译 T(),解释 T(n)
.find的路径问题:-newer 读取文件时间默认是在当前路径,因此需要显示 cd 或者 -newer 绝对路径
find /tmp/mstat ! -newer `date -I -d'3 days ago'`
find: --: 没有那个文件或目录
cd /tmp/mstat; find /tmp/mstat ! -newer `date -I -d'3 days ago'`
/tmp/mstat/--
.sed 模式匹配//与模式替换s///的语法区别:
当都是 / 做分隔符并无区别,但是当不是 / 的时候是有语法区别的:
sed '\@/usr/local/test.txt@d' # 第一个字符需要转义,man sed 语法如此,因为还可以被解析为行号
sed 's@/usr/local/test.txt@@' # 只能被解析为字符串内容,没有歧义
.iptables 的保存:
/etc/init.d/iptables save就好了,保存到 /etc/sysconfig/iptables,启动自己会去读取的
也可以手动 iptables-save > a.txt 或者 iptables-restore < a.txt
.curl 获取网页的状态码:
http_code=`curl -I -s www.baidu.com -w %{http_code}` && echo ${http_code::}
.awk中的隐式数据类型转换:
awk 'BEGIN{a="7868";if(a>=6211&&a<=10075)print "ok"}'
awk 'BEGIN{a="56";if(a>=3&&a<=7189)print "ok"}'
结果不一致是由于在gawk中,数字和字符串同时比较会发生隐式类型转换,
会把数字转换成字符串,然后按字符串排序(字典序),要想用数字比较,
需要显示转换类型:a=; 或者 a=");
需要注意的是这样他只会转换以数字开头到第一个字母前的字符串
如:
echo |awk '{print "a12b"+0,"|",int("a12b"),"|","12b1"+0,"|",int("12b1")}'
| | |
awk的sorti也是使用字符串做索引排序,需要注意
shell 学习笔记1501-1800的更多相关文章
- SHELL学习笔记----IF条件判断,判断条件
SHELL学习笔记----IF条件判断,判断条件 前言: 无论什么编程语言都离不开条件判断.SHELL也不例外. if list then do something here ...
- shell学习笔记
shell学习笔记 .查看/etc/shells,看看有几个可用的Shell . 曾经用过的命令存在.bash_history中,但是~/.bash_history记录的是前一次登录前记录的所有指令, ...
- [转帖][Bash Shell] Shell学习笔记
[Bash Shell] Shell学习笔记 http://www.cnblogs.com/maybe2030/p/5022595.html 阅读目录 编译型语言 解释型语言 5.1 作为可执行程序 ...
- shell学习笔记汇总
1.shell脚本中函数使用 函数定义在前,调用在后,顺序反了就没有效果了.函数调用为:函数名 参数列表 函数内部通过以下变量访问函数的参数:shell脚本函数中: $0: 这个脚本的名字 $n: 这 ...
- shell 学习笔记2-shell-test
一.字符串测试表达式 前面一篇介绍:什么是shell,shell变量请参考: shell 学习笔记1-什么是shell,shell变量 1.字符串测试表达式参数 字符串需要用""引 ...
- SHELL学习笔记三
SHELL学习笔记一 SHELL学习笔记二 SHELL学习笔记三 for 命令 读取列表中的复杂值 从变量读取列表 从命令读取值 更改字段分隔符 用通配符读取目录 which 使用多个测试命令 unt ...
- 【转】shell学习笔记(一)——学习目的性、特殊字符、运算符等
1 学习shell的目的性 写之前我们先来搞清楚为什么要学shell,学习要有目的性 shell简单.灵活.高效,特别适合处理一些系统管理方面的小问题 shell可以实现自动化管理,让系统管理员的工作 ...
- [Bash Shell] Shell学习笔记
1. Shell简介 Shell本身是一个用C语言编写的程序,它是用户使用Unix/Linux的桥梁,用户的大部分工作都是通过Shell完成的.Shell既是一种命令语言,又是一种程序设计语言.作为命 ...
- shell 学习笔记
<Linux命令行与shell脚本编程大全>笔记 wkss 其他:http://www.cnblogs.com/pengdonglin137/p/3528303.html 一.基本命令 ...
随机推荐
- contact表单错误解决记录
在上篇表单验证中,过程中可谓坎坷,记录一下错误问题及解决方案. 我们用到的模板contact_form.html如下,其他urls.py自行去修改. <html> <head> ...
- jQueryindex();eq();利用数组来操作多个事件
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- PHP开发调试环境配置
——基于wamp和Eclipse for PHP Developers 引言 为了搭建PHP开发调试环境,我曾经在网上查阅了无数的资料,但没有一种真正能够行的通的.因为PHP开发环境需要很多种软件相互 ...
- Flink Program Guide (4) -- 时间戳和Watermark生成(DataStream API编程指导 -- For Java)
时间戳和Watermark生成 本文翻译自Generating Timestamp / Watermarks --------------------------------------------- ...
- python 自学笔记(四) 列表
有几天没有更新博客了,毕竟是自学,最近事情确实比较多,有时候想学的时候反而没时间,到有时间的时候反而不想学.以后得想办法改掉这个缺点,只要有时间就要学习自己想学的东西,希望自学的同学能和我共同交流,其 ...
- android4.0 HttpClient 以后不能在主线程发起网络请求
android4.0以后不能在主线程发起网络请求,该异步网络请求. new Thread(new Runnable() { @Override public void run() { // TODO ...
- 从一个实例,看new FunctionName()的内部机制
下面的代码: function Dog(name) { this.name = name; Dog.prototype = { shout: function() { alert("I am ...
- CC++初学者编程教程(11) 配置Windows数据库服务器
1.我们新建一个虚拟机. 2. 选择默认的WorkStation10.0. 3.我们选择VS2012的镜像. 4.我们设置用户密码,跳过WindowsSever2012密钥 5.我们选择是,稍后手动激 ...
- @Transactional 注解说明
先让我们看代码吧! 以下代码为在"Spring3事务管理--基于tx/aop命名空间的配置"基础上修改.首先修改applicationContext.xml如下: <pre ...
- 网易云课堂_程序设计入门-C语言_第二周:判断_1时间换算
1 时间换算(5分) 题目内容: UTC是世界协调时,BJT是北京时间,UTC时间相当于BJT减去8.现在,你的程序要读入一个整数,表示BJT的时和分.整数的个位和十位表示分,百位和千位表示小时.如果 ...