awk对某个字段分割处理

工作中遇到要根据文件中某个字段分割成多行文本的处理，想到用awk处理，这里记录下：

问题：

原文件：假设一共2个字段，用“|”分割，其中第二个字段用“#”分割，但该字段中也有不含“#”的值和空值

要求：根据第二个字段，若含#，将这条数据根据#分割成多条数据，无#和无值的行不变

202143108500|#0_1000_VOICE#0_1000_VOICE#0_1000_VOICE#0_TRAFFIC#0_TRAFFIC#0_TRAFFIC

202121366359|#0_1000_VOICE#0_TRAFFIC

202143108500|#0_1000_VOICE#0_1000_VOICE#0_1000_VOICE#0_TRAFFIC#0_TRAFFIC#0_TRAFFIC

202121366359|#0_1000_VOICE#0_TRAFFIC

202113492312|W_GH_YYM

202132164529|

用awk解决：

1、将含“#”的一行变多行

awk -F "|"  -vOFS="|"  '{l=split($2,arr,"#");for(i=1;i<l;i++){$2=arr[i+1];print}}' ./test.txt

结果：

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202121366359|0_1000_VOICE

202121366359|0_TRAFFIC

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202121366359|0_1000_VOICE

202121366359|0_TRAFFIC

2、将不含“#”筛选出来

awk -F "|"  '$2!~/#/{print}' ./test.txt

结果：

202113492312|W_GH_YYM

202132164529|

经过上面两步就可以解决，将结果生成新的文件 a.txt

awk -F "|"  -vOFS="|"  '{l=split($2,arr,"#");for(i=1;i<l;i++){$2=arr[i+1];print}}' ./test.txt >a.txt

awk -F "|"  '$2!~/#/{print}' ./test.txt >>a.txt

a.txt:

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202121366359|0_1000_VOICE

202121366359|0_TRAFFIC

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202121366359|0_1000_VOICE

202121366359|0_TRAFFIC

202113492312|W_GH_YYM

202132164529|

awk对某个字段分割处理的更多相关文章

awk之FIELDWIDTHS字段宽度
$ cat file 1234567890 $ awk -vFIELDWIDTHS="1 2 3 4 5" -vOFS="|" 'NF=NF' file 1|2 ...
文本替换sed+字段处理cut,join+awk重新编排字段
[1]sed工具(Stream Editor)--流编辑器 sed 本身也是一个管线(管道)命令,可以分析 standard input 的啦! 而且 sed 还可以将数据进行取代.删除.新增.截取特 ...
ArcGIS自定义工具箱-字段分割
ArcGIS自定义工具箱-字段分割联系方式:谢老师,135-4855-4328,xiexiaokui#qq.com 目的:用指定分割符分割字段, 用例:湖南省长沙市=>湖南/长沙数据源: 使 ...
awk将某个字段按照分隔符分割之后统计次数
cat label_movie2|grep BBD252CC0A4FE7D10C990261D5CEACB5|awk -F "," '{for(i=2;i<NF;i++) p ...
sed（查找替换）与awk（提取字段）
通常: sed 处理列 awk处理行比较方便 Sed是一个基本的查找替换程序 sed -i "s/^@//g" 文件 #原地操作原文件,进行替换 cat ...
3.3.4 使用 awk 重新编排字段
awk 本身所提供的功能完备,已经是一个很好用的程序语言了.以后会好好地介绍该语言的精髓.虽然 awk 能做的事很多,但它主要的设计是要在 Shell脚本中发挥所长:做一些简单的文本处理,例如取出字段 ...
awk查找特定字段
在一行中,查找字段包含exe的: ###########awk.awk######## { for(i=1;i<NF;i++) { if($i ~ /exe/) { print $i } } } ...
awk截取指定字段
#!/bin/bash #好多地方可以优化,先记录下,便于以后使用 dir="/logs/$1"file="/logs/$1/requests.log"if [ ...
Python中的字段分割
很多时候我们要完成分词的任务,这篇文章讲的非常非常好.生动形象,原文是https://www.cnblogs.com/douzi2/p/5579651.html,作者是宋桓公.

随机推荐

MindSpore整体架构介绍
MindSpore整体架构介绍 MindSpore框架架构总体分为MindSpore前端表示层.MindSpore计算图引擎和MindSpore后端运行时三层. MindSpore前端表示层(Mind ...
大规模数据处理Apache Spark开发
大规模数据处理Apache Spark开发 Spark是用于大规模数据处理的统一分析引擎.它提供了Scala.Java.Python和R的高级api,以及一个支持用于数据分析的通用计算图的优化引擎.它 ...
CVPR2020：点云分类的自动放大框架PointAugment
CVPR2020:点云分类的自动放大框架PointAugment PointAugment: An Auto-Augmentation Framework for Point Cloud Classi ...
python_request 接口测试线性框架，模块化思想，增加日志打印
一.大框架如下为一个简单的线性框架,同时编写common_api 模块,把一个个接口进行封装,案例编写时候只需要直接调用输入参数即可. 二. test_cases 模块具体写法 2.1 commo ...
ES6中的Map
今天小编和大家一起探讨一下引用类型中的map,在其中会有一些map与数组联合应用,还有和map类似的weakmap类型的说明,这篇文章同时也增加了一些操作数组的办法和实际应用.大家也可以关注我的微信公 ...
Air530Z GPS/北斗定位模块_设计指导手册_V1.2
下载PDF版本: Air530Z_定位模块_设计指导手册_V1.2.pdf @ 目录 1. 模块整体说明 2. 资料下载 3. 模块性能 4.模块管脚图 5.参考设计电路 6.GPS天线 6.1 无源 ...
小白学k8s(9)-gitlab-runner实现go项目的自动化发布
gitlab构建CI/CD 准备 docker部署gitlab 使用二进制部署gitlab-runner gitlab-runner注册配置Variables 简单先来个测试开始构建遇到的报错 ...
【TCP/IP】TCP服务器并发处理&源码
前言本笔记记录的是单个服务端并发式处理多个客户端. 下次有空在发个单线程多个服务端并发式处理多种客户端.其实就是本笔记的一个改良版,用到select() / poll() / epoll(). ...
Linux中curl的用法
一.简介:在Linux中curl是一个利用URL规则在命令行下工作的文件传输工具,是一款强大的http命令行工具.支持文件的上传和下载,是综合传输工具. 二.语法:curl [option] [url ...
Web自动化之iframe切换
一.如何判断元素是否在iframe中选中要操作的元素,通过下方的父节点查看是否存在iframe,存在则元素在iframe,需要切换至iframe中进行元素的操作二.iframe切换方式一 1.方式 ...

awk对某个字段分割处理

awk对某个字段分割处理的更多相关文章

随机推荐

热门专题