1.打开Cygwin,把需要处理的文本复制你的安装目录例如:D:\cygwin\home\Administrator

使用 ls命令查看根目录文件

2.现在我们就可以对1.txt文本进行操作,

3.我常用到命令

Sort排序功能】

1.指定列正向排序

对文本第一列排序 默认TAB分割

Sort -k 1 1.txt -o 输出.txt

对文本第二列排序 :分割

Sort -t: -k 2 1.txt -o 输出.txt

  

2.指定列逆向排序

对文本第一列排序 默认TAB分割

Sort -r -k 1 1.txt -o 输出.txt

  

对文本第二列排序 自定义分割符号“:”

Sort -r -t: -k 2 1.txt -o 输出.txt

  

3.指定列排序并去重

对文本第一列排序 默认TAB分割

Sort -u -r -k 1 1.txt -o 输出.txt

  

对文本第二列排序 自定义分割符号“:”

Sort -u -r -t: -k 2 1.txt -o 输出.txt

  

1.通用正向排序

sort 1.txt -o 输出.txt

2.通用逆向排序

sort -r 1.txt -o 输出.txt

3.数字正向排序

sort -n 1.txt -o 输出.txt

4.排序并去重

sort -u 1.txt -o 输出.txt

Uniq统计】

1.统计文本出现次数

详解:排序之后删除了重复行,同时在行首位置输出该行重复的次数

#sort testfile | uniq -c

1 friend

3 hello

2 world

2.只输出重复的行,并输出重复次数

#sort testfile | uniq -d -c

3 hello

2 world

3.仅显示不重复的行

sort testfile | uniq -u

split分割】

1.按行分割

分割成10行  文件名5位数字开头

split -l 10 -d -a 5  file

2.按MB分割

分割成10MB大小  文件名5位数字开头

split -b 10m -d -a 5 file

Cat 合并文件】

Cat命令详解:http://www.cnblogs.com/perfy/archive/2012/07/23/2605550.html

1.合并多个文件

Cat 1.txt 2.txt 3.txt > hb.txt

2.合并整个文件夹

Cat *.txt > newfile

Sed 】

以行为单位行头行尾添加字符

1.行首添加字符

在每行的头添加字符,比如"TOU_",命令如下:

sed 's/^/TOU_&/g' 1.txt

2.行尾添加字符

2.在每行的尾添加字符,比如"Wei_",命令如下:

sed 's/$/Wei_&/g' 1.txt

3.每一行的行头和行尾分别添加字符

sed '/./{s/^/Tou_/;s/$/Wei/}' 1.txt

"^"代表行首,"$"代表行尾

's/$/&TAIL/g'中的字符g代表每行出现的字符全部替换,如果想在特定字符处添加,g就有用了,否则只会替换每行第一个,而不继续往后找了

以行为单位的新增/删除

将第 2~5 行删除

sed '2,5d

只要删除第 2 行

sed '2d'

要删除第 3 到最后一行

sed '3,$d'

在第二行后(亦即是加在第三行)加上『drink tea?』字样!

sed '2a drink tea'

那如果是要在第二行前

sed '2i drink tea'

以行为单位的替换与显示

将第2-5行的内容取代成为『No 2-5 number』呢?

sed '2,5c No 2-5 number'

仅列出文件内的第 5-7 行

Sed -n '5,7p'

数据的搜寻并显示

搜索有root关键字的行 模糊搜索哦

sed -n '/root/p

数据的搜寻并删除

删除/etc/passwd所有包含root的行,其他行输出

nl /etc/passwd | sed '/root/d'

数据的搜寻并替换

sed 's/要被取代的字串/新的字串/g' 1.txt

替换@开 到TAB尾

sed 's/@[^\t]*\t/\t/g' 1.txt

只保留有某个字符的行 用于保留某行,或者删除没有分隔符的行

sed -n '/\t/p'> out.txt  只输出包含TAB的行

WC 】

统计行数,在对记录数时,很常用

Wc -l 1.txt

使用Cygwin在WIN系统下处理文本常用命令的更多相关文章

  1. 解决在win系统下使用DOS命令开启TensorBoard的问题及方法步骤

    解决在win系统下使用DOS命令开启TensorBoard的问题及方法步骤: TensorBoard是TensorFlow下的一个可视化的工具,能够帮助研究者们可视化训练大规模神经网络过程中出现的复杂 ...

  2. win系统下启动linux上的kafka集群及使用

    一.首先在win系统下C:\Windows\System32\drivers\etc文件夹中hosts文件加入例如以下内容: 10.61.6.167 slaves1 10.61.6.168 slave ...

  3. Linux 系统下安装 rz/sz 命令及使用说明

    Linux 系统下安装 rz/sz 命令及使用说明 rz/sz命令,实现将本地的文件上传到服务器或者从服务器上下载文件到本地,但是很多Linux系统初始并没有这两个命令,以下为安装和使用的具体步骤: ...

  4. 【linux配置】Linux系统下安装rz/sz命令以及使用说明

    Linux系统下安装rz/sz命令以及使用说明 对于经常使用Linux系统的人员来说,少不了将本地的文件上传到服务器或者从服务器上下载文件到本地,rz / sz命令很方便的帮我们实现了这个功能,但是很 ...

  5. Linux 系统基础优化和常用命令

    目录 Linux 系统基础优化和常用命令 软连接 tar解压命令 gzip命令 netstart命令 ps命令 kill命令 killall命令 SELinux功能 iptables防火墙 Linux ...

  6. 运维 07 Linux系统基础优化及常用命令

    Linux系统基础优化及常用命令   Linux基础系统优化 引言没有,只有一张图. Linux的网络功能相当强悍,一时之间我们无法了解所有的网络命令,在配置服务器基础环境时,先了解下网络参数设定命令 ...

  7. 实验 1 Linux 系统的安装和常用命令

    实验 1 Linux 系统的安装和常用命令 (题目) 一.实验目的 (1)掌握 Linux 虚拟机的安装方法.Spark 和 Hadoop 等大数据软件在 Linux 操作系统 上运行可以发挥最佳性能 ...

  8. win 系统下制作U盘安装 linux系统

    win 系统制作U盘安装硬盘镜像用ultraiso_v9.5.3.2901将Centos.iso写进U盘.安装过程全程区分大小写.过低的ultraiso不能正确读取文件.本文所有资料均能在网上免费下载 ...

  9. win系统下的eclipse连接和使用linux上的hadoop集群

    准备工作 先在win系统的hosts文件中加入下面内容 10.61.6.164master     //hadoop集群的master节点 一.首先在eclipse上安装hadoop插件 下载hado ...

随机推荐

  1. Oracle JDBC 连接卡死后 Connection Reset

    坑 这绝对是我碰计算机以来遇到的第一大坑! 症状: 在Linux主机上远程登录,执行一个简单的Oracle的JDBC连接程序(jar包),结果硬生生的卡在了连接建立验证阶段,然后等上几分钟后因为连接超 ...

  2. 基于CSS3的3D旋转效果

    自从有了html5和css3,好多以前只能想想的华丽效果都可以上手实现了.3D 转换(个人认为3D变换更贴切^)就是其中之一.关于3D转换,可以阅读CSS3 3D transform变换,不过如此,文 ...

  3. es6新语法的使用

    1.声明变量: let 声明变量 作用域代码块作用域{} 尽在模块 先使用后声明 会报错 { let a= 12; alert(a) } let 不允许重复声明同一个变量 const 声明是一个常量, ...

  4. Iscrool下拉刷新

    简易下拉刷新 css样式: *{ margin: 0px; padding: 0px; } #wrapper{ width: 100%; height: 150px; border: 1px soli ...

  5. C++基础--结构体声名

    struct是一种数据结构,当需要存储的相关数据为一个集合时,struct是很好的选择;例如,当存储student,学生的学号, 名字,年龄,身高,就构成了一个集合,用stuct声名为: typede ...

  6. 《ArcGIS Runtime SDK for Android开发笔记》——问题集:如何解决ArcGIS Runtime SDK for Android中文标注无法显示的问题(转载)

    Geodatabase中中文标注编码乱码一直是一个比较头疼的问题之前也不知道问题出在哪里?在百度后发现园子里的zssai已经对这个问题原因做了一个详细说明.这里将原文引用如下: 说明:此文转载自htt ...

  7. Excel数据导入Sql Server,部分数字为Null

    在Excel中,我们时常会碰到这样的字段(最常见的就是电话号码),即有纯数字的(如没有带区号的电话号码),又有数字和其它字符混合 (如“区号-电 话号码”)的数据,在导入SQLServer过程中,会发 ...

  8. Linux文件压缩和解压缩命令

    Linux文件压缩和解压缩命令: tar 命令(打包并压缩的话,原文件也会默认存在) -c 建立打包档案 -x 解包 -t 查看包里的类容 -r 向包里追加文件 -v 显示打包过程 -f 文件 比如: ...

  9. HXXXES 高可用双机RMAN异地备份 Notes

    一.总览 大致上的逻辑如上图,简化细节来归纳,便是 用一个bat脚本来驱动整个备份过程.   二.一些准备工作 1.为备份所需的脚本,以及最终备份生成的文件创建目录    开始=>运行=> ...

  10. ORACLE常用函数汇总(持续更新中....)

    在使用ORACLE过程中,把一些常用的函数的相关用法,注意事项进行简单的汇总,便于自己查询参考. DBMS_RANDOM包 dbms_random是一个可以生成随机数值或者字符串的程序包.这个包有in ...