awk对某个字段分割处理

工作中遇到要根据文件中某个字段分割成多行文本的处理，想到用awk处理，这里记录下：

问题：

原文件：假设一共2个字段，用“|”分割，其中第二个字段用“#”分割，但该字段中也有不含“#”的值和空值

要求：根据第二个字段，若含#，将这条数据根据#分割成多条数据，无#和无值的行不变

202143108500|#0_1000_VOICE#0_1000_VOICE#0_1000_VOICE#0_TRAFFIC#0_TRAFFIC#0_TRAFFIC

202121366359|#0_1000_VOICE#0_TRAFFIC

202143108500|#0_1000_VOICE#0_1000_VOICE#0_1000_VOICE#0_TRAFFIC#0_TRAFFIC#0_TRAFFIC

202121366359|#0_1000_VOICE#0_TRAFFIC

202113492312|W_GH_YYM

202132164529|

用awk解决：

1、将含“#”的一行变多行

awk -F "|"  -vOFS="|"  '{l=split($2,arr,"#");for(i=1;i<l;i++){$2=arr[i+1];print}}' ./test.txt

结果：

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202121366359|0_1000_VOICE

202121366359|0_TRAFFIC

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202121366359|0_1000_VOICE

202121366359|0_TRAFFIC

2、将不含“#”筛选出来

awk -F "|"  '$2!~/#/{print}' ./test.txt

结果：

202113492312|W_GH_YYM

202132164529|

经过上面两步就可以解决，将结果生成新的文件 a.txt

awk -F "|"  -vOFS="|"  '{l=split($2,arr,"#");for(i=1;i<l;i++){$2=arr[i+1];print}}' ./test.txt >a.txt

awk -F "|"  '$2!~/#/{print}' ./test.txt >>a.txt

a.txt:

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202121366359|0_1000_VOICE

202121366359|0_TRAFFIC

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_1000_VOICE

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202143108500|0_TRAFFIC

202121366359|0_1000_VOICE

202121366359|0_TRAFFIC

202113492312|W_GH_YYM

202132164529|

awk对某个字段分割处理的更多相关文章

awk之FIELDWIDTHS字段宽度
$ cat file 1234567890 $ awk -vFIELDWIDTHS="1 2 3 4 5" -vOFS="|" 'NF=NF' file 1|2 ...
文本替换sed+字段处理cut,join+awk重新编排字段
[1]sed工具(Stream Editor)--流编辑器 sed 本身也是一个管线(管道)命令,可以分析 standard input 的啦! 而且 sed 还可以将数据进行取代.删除.新增.截取特 ...
ArcGIS自定义工具箱-字段分割
ArcGIS自定义工具箱-字段分割联系方式:谢老师,135-4855-4328,xiexiaokui#qq.com 目的:用指定分割符分割字段, 用例:湖南省长沙市=>湖南/长沙数据源: 使 ...
awk将某个字段按照分隔符分割之后统计次数
cat label_movie2|grep BBD252CC0A4FE7D10C990261D5CEACB5|awk -F "," '{for(i=2;i<NF;i++) p ...
sed（查找替换）与awk（提取字段）
通常: sed 处理列 awk处理行比较方便 Sed是一个基本的查找替换程序 sed -i "s/^@//g" 文件 #原地操作原文件,进行替换 cat ...
3.3.4 使用 awk 重新编排字段
awk 本身所提供的功能完备,已经是一个很好用的程序语言了.以后会好好地介绍该语言的精髓.虽然 awk 能做的事很多,但它主要的设计是要在 Shell脚本中发挥所长:做一些简单的文本处理,例如取出字段 ...
awk查找特定字段
在一行中,查找字段包含exe的: ###########awk.awk######## { for(i=1;i<NF;i++) { if($i ~ /exe/) { print $i } } } ...
awk截取指定字段
#!/bin/bash #好多地方可以优化,先记录下,便于以后使用 dir="/logs/$1"file="/logs/$1/requests.log"if [ ...
Python中的字段分割
很多时候我们要完成分词的任务,这篇文章讲的非常非常好.生动形象,原文是https://www.cnblogs.com/douzi2/p/5579651.html,作者是宋桓公.

随机推荐

马斯克如何颠覆航天？ 1/5385成本，c++和python编程！
马斯克如何颠覆航天? 1/5385成本,c++和python编程! 5月31日,经历了重重困难,马斯克的SpaceX载人飞船成功发射,这是美国自2011年以来首次发射载人航天飞船,也是美国进入由商业主 ...
.Net RabbitMQ实战指南——进阶(一)
备份交换器备份交换器,英文名称为Alternate Exchange,简称AE.通过在声明交换器(调用channel.ExchangeDeclare方法)时添加alternate-exchange参 ...
硬核！2w 字长文爆肝分布式事务知识点！！
前言分布式事务,是分布式架构中一个绕不开的话题,而什么是分布式事务?为什么要使用分布式事务?分布式事务有哪些实现方案?更是面试时面试官特别喜欢的一个分布式三连炮!同时用XMind画了一张导图记录分布 ...
Mysql数据库值的添加、修改、删除及清空
3.MySQL数据管理第一种方式:不太建议,看起来复杂些 -- 学生表的 gradeid 字段,要去引用年级表的 gradeid -- 定义外键key -- 给这个外键添加约束,(执行引用),RE ...
【NX二次开发】开发环境搭建
1.Visual Studio 版本按照下表选择. UG版本 VS版本 NX1847-NX1872版 Visual Studio 2017 Build 19.10.25017 NX12版 Visual ...
python学习笔记04-了解操作符与条件分支
先来了解一下条件操作符: 运算符描述示例 == 检查两个操作数的值是否相等,如果是则条件变为真. 如a=3,b=3则(a == b) 为 true. != 检查两个操作数的值是否相等,如果值不相等 ...
详解详解Java中static关键字和final关键字的功能
摘要:static关键字和final关键字是Java语言的核心,深入理解他们的功能非常重要. 本文分享自华为云社区<Java: static关键字与final关键字>,原文作者:唐里 . ...
『心善渊』Selenium3.0基础 — 5、XPath路径表达式详细介绍
目录 1.XPath介绍 2.什么是XML 3.XML与HTML对比 4.为什么使用XPath定位页面中的元素 5.XPath中节点之间的关系 (1)节点的概念 (2)节点之间的关系类型 6.XPat ...
深入理解 Android ANR 触发原理以及信息收集过程
一.概述作为 Android 开发者,相信大家都遇到过 ANR.那么为什么会出现 ANR 呢,ANR 之后系统都做了啥.文章将对这个问题详细解说. ANR(Application Not respo ...
三剑客-awk
1.作用特点排除信息查询信息统计信息替换信息 2.语法格式 awk [参数] '模式-动作' 文件 3.awk命令执行原理 4.命令使用方法创建测试环境 [root@shuai ~]# ca ...

awk对某个字段分割处理

awk对某个字段分割处理的更多相关文章

随机推荐

热门专题