Linux学习日记——字符处理
(菜鸡学习日记 各种使用命令只列举了常用几种,发现错误望指正)
一、管道
在Linux 中,管道就是一个固定大小的缓冲区,大小为一页4K。它是一种通信的机制,可以使用管道符“ | ” 来连接进程,连接的进程可以自动运行。它的实现方式其实就是将前一个输出当做后一个进程的输入。
二、grep
grep 是Linux 中基于行的文本搜索工具,输出为匹配到的所有符合条件的行。使用方式以及常用参数如下:
grep [-icnv] '匹配的字符' filename(-i:忽略大小写 -c:统计包含条件的行数 -n:输出行号 -v:反向搜索)
三、sort
sort 命令就是对无序数据进行排序,命令以及其常用参数如下:
sort [-ntkr] filename (-n:使用数字排序 -t:指定分隔符 -k:指定第几列 -r:反向排序)
举例说明:cat log.txt | sort -t ":" -k -2 -n(打开文件 log.txt (该文件中存在冒号隔开),对冒号隔开后的第二列按照数字排序,说明 如果没有指定-n 即使是数字也会按照String进行排序)
四、uniq
如果一个文件中出现多行完全相同的内容,在某些应用场景下需要消除重复的行,只留一行方便处理,或者说要统计出重复行的出现次数,这时候就可以使用uniq命令了(注:uniq 一般都是和sort 命令配合进行使用,先使用sort 对文件进行排序,这样重复的行就回彼此相邻,再使用uniq 命令进行操作,因为uniq 命令只会对相邻的行进行过滤,如果有重复则删除若干行重复的内容。)
使用方式: cat test.txt | sort | uniq
( 如果使用 uniq -c 则输出包括空行在内的重复行的重复次数 )
五、cut
cut 截取命令,同样这个命令也是以行为单位进行操作,可以通过指定格式取出用户所需要的部分,文件中又特定分隔符时可以使用分隔符进行截取,用法如下:
cut -f 指定的列 -d ' 分隔符 '
cat /etc/passwd | cut -f1,5 -d ' : ' (以冒号分隔,打印出passwd 文件的第1列和第5列 )
上面例子中,文件passwd 是存在固定分隔符的文件,如果是没有特定分隔符的情况,cut 还可以通过指定字符数来截取:
cat /etc/passwd | cut -c1-5,7-10 (打印passwd 文件每行1-5个字符,以及7-10个字符的内容)
六、tr
tr 命令十分简单,主要作用在于文本的转换和删除操作,下面就举两个小栗子演示一下
1)文本转换
cat test.txt | tr '[a-z]' '[A-Z]' (将test.txt 文件中的所有小写字母转换成大写字母)
2)删除
cat test.txt | tr -d ' : ' (将文件中所有的冒号删除)
七、paste 与 split
这两个命令作用相反,paste 用作文本合并,split 用作分割文件
1)paste 还是以行为单位进行合并,用法也很简单:
paste a.txt b.txt
2)split 进行分割,需要分割的文本一般比较大,不然也就没有分割的必要了(注:文件的分割在Linux 中有两种,按行分割和按照大小分割,需要注意的是二进制文件无法按照行去分割,因为二进制没有“行”的概念),这个命令只介绍一下,笔者还没有用过,就列出他的文档供阅读。
-a, --suffix-length=N use suffixes of length N (default 2) 指定拆分文件的后缀长度
-b, --bytes=SIZE put SIZE bytes per output file 按字节拆分,默认单位字节
-C, --line-bytes=SIZE put at most SIZE bytes of lines per output file 指定单行的最大大小,默认单位字节
-d, --numeric-suffixes use numeric suffixes instead of alphabetic 用数字作为拆分文件的后缀
-l, --lines=NUMBER put NUMBER lines per output file 按行数进行拆分
--verbose print a diagnostic just before each
output file is opened
--help display this help and exit
--version output version information and exit
Linux学习日记——字符处理的更多相关文章
- Linux学习日记-使用EF6 Code First(四)
一.在linux上使用EF 开发环境 VS2013+mono 3.10.0 +EF 6.1.0 先检测一下EF是不是6的 如果不是 请参阅 Linux学习日记-EF6的安装升级(三) 由于我的数据库 ...
- Linux 学习日记 1
这是我第一次系统地学习Linux,希望通过这个学习日记收获一些东西把-- @_@ Grub - 启动管理器 在启动时让用户选择要启动的系统.(但是windows比较霸道--重装windows后会将 ...
- Linux学习日记-(一)
一.为什么学习Linux 大学时开始接触Linux,最开始学习的是RedHat(小红帽),感觉Linux好像很久不见的老朋友,用起来很舒服(虽然我们用的是DotNet).很喜欢它的命令模式,让我能接触 ...
- linux学习日记之老男孩
2016年10月5日企业面试题:cp 命令复制文件是如果有覆盖可能的话如何去除确认步骤,如:将/mnt/text.txt 复制 到/temp/text.txt,去除覆盖确认命令.方法:1.加全路径的c ...
- Linux学习 :字符设备框架
一.系统功能框架: U-boot : 启动内核 linux kernel: 启动应用 应用: open,read,write 都是通过C库实现,汇编就相当于swi val,引发中断,通过系统调用接口在 ...
- Linux学习日记——源码编译Apache
[本文为笔者在学习Linux 下的软件安装时,尝试使用源码安装Apache 的过程,事后进行一个小小的总结,发现错误望指正.] 一.典型的源码编译安装软件的过程包括以下3步: 1) 运行 config ...
- Linux学习日记(二)
在linux上运行.Net程序 并安装Linux网站 一.环境 ubuntu14.10(桌面版 官网下载的最新版) jexus5.6.3 正式版 MonoDevloper (安装完后里面有个Ubunt ...
- linux学习日记之鸟哥
2016年10月11日星期二 df命令解释:用于显示磁盘分区上可以使用的磁盘空间.默认显示单位为KB,可以用该命令来获取硬盘被占用了多少空间,目前还剩多少空间等信息.用法:df 选项 参数例:df – ...
- Linux学习日记之磁盘与档案系统
主要定义 磁盘的物理组成磁盘主要由圆形磁盘(多张).机械手臂.磁头等组成.每张磁盘都有不同的磁道,半径相同的磁道组成了磁柱,沿着中心划线可将磁盘分成若干扇区,每个扇区的大小是512Bytes. 磁盘分 ...
随机推荐
- javascript中创建对象和实现继承
# oo ##创建对象 1. 原型.构造函数.实例之间的关系 * 原型的construct->构造函数:调用isPrototypeOf(obj)方法可以判定和实例的关系: * 构造函数的pro ...
- 超实用的JavaScript代码段
1. 判断日期是否有效 JavaScript中自带的日期函数还是太过简单,很难满足真实项目中对不同日期格式进行解析和判断的需要.JQuery也有一些第三方库来使日期相关的处理变得简单,但有时你可能只需 ...
- Js中判断变量存不存在的问题
前面写过jquery对象存在与否的判断.现在谈下Js中判断变量存不存在的问题. 如果这样if(!a),当变量a在js中没有申明时,就会报错,那么接下去的代码将不会被执行.注意,这种判断只要变量申明过, ...
- BZOJ 1601: [Usaco2008 Oct]灌水 最小生成树_超级源点
Description Farmer John已经决定把水灌到他的n(1<=n<=300)块农田,农田被数字1到n标记.把一块土地进行灌水有两种方法,从其他农田饮水,或者这块土地建造水库. ...
- pandaboy Merry Christmas
- Project Euler 37 Truncatable primes
题意:3797有着奇特的性质.不仅它本身是一个素数,而且如果从左往右逐一截去数字,剩下的仍然都是素数:3797.797.97和7:同样地,如果从右往左逐一截去数字,剩下的也依然都是素数:3797.37 ...
- LCA 最近公共祖先 (笔记、模板)
求lca的方法大体有三种: 1.dfs+RMQ(线段树 ST表什么的) 在线 2.倍增 在线 3.tarjan 离线 ps:离线:所有查询全输入后一次解决 在线:有一个查询输出一次 以下模板题为 洛谷 ...
- P1828 香甜的黄油 Sweet Butter (spfa)
题目描述 农夫John发现做出全威斯康辛州最甜的黄油的方法:糖.把糖放在一片牧场上,他知道N(1<=N<=500)只奶牛会过来舔它,这样就能做出能卖好价钱的超甜黄油.当然,他将付出额外的费 ...
- 《代码敲不队》第八次团队作业:Alpha冲刺 第一天
项目 内容 这个作业属于哪个课程 任课教师博客主页链接 这个作业的要求在哪里 作业链接地址 团队名称 代码敲不队 作业学习目标 掌握软件编码实现的工程要求. 第一天 日期:2019/6/15 团队项目 ...
- JavaScript(DOM编程补充一)
HTML属性的直接调用: 还可以通过getAttribute方法获取属性的值: setAttribute方法: removeAttribute ---------------------------- ...