b2_trsd_EDSD

 # -*- coding:utf-8 -*-

 import re

 ss="./data/"

 year = '17A'

 filename = ss+'EDSD%s.txt'%year

 '''

 适应新版本

 '''

 p1 = r"^\s{4}(?:X|\W)\s{2}([A-Z]{3})\s\s.+\n"#TC

 p2 = r"(^\d{3})\s{4}C\d{3}.+[CM]\s+\d\n"#

 p3 = r"^\d{3}\s{4}(C\d{3}).+[CM]\s+\d\n"#C552

 p4 = r"^\d{3}\s{4}C\d{3}.+([CM])\s+\d\n"#M

 p5 = r"^\d{3}\s{4}C\d{3}.+[CM]\s+(\d)\n"#

 p6= r"(^\d{3})\s{4}\d{4}.+[CM]\s{4}\d\s.*\.\.\d+\n|(^\d{3})\s{4}\w\d{3}\s.+[^\d]$\n"#单独的030

 p7 =r"^\d{3}\s{4}(\d{4}).+[CM]\s{4}\d\s.*\.\.\d+\n|^\d{3}\s{4}(\w\d{3})\s.+[^\d]$\n"#单独的3286

 p8 =r"^\d{3}\s{4}\d{4}.+([CM])\s{4}\d\s.*\.\.\d+\n|^\s{12}[A-Z].+([CM])\s{4}\d\s.*\.\.\d+\n"#单独的M

 p9 =r"^\d{3}\s{4}\d{4}.+[CM]\s{4}(\d)\s.*\.\.\d+\n|^\s{12}[A-Z].+[CM]\s{4}(\d)\s.*\.\.\d+\n"#单独的1

 p10 =r"^\d{3}\s{4}\d{4}.+[CM]\s{4}\d\s(.*\.\.\d+)\n|^\s{12}[A-Z].+[CM]\s{4}\d\s(.*\.\.\d+)\n"#单独的an..35

 pattern1 = re.compile(p1)

 pattern2 = re.compile(p2)

 pattern3 = re.compile(p3)

 pattern4 = re.compile(p4)

 pattern5 = re.compile(p5)

 pattern6 = re.compile(p6)

 pattern7 = re.compile(p7)

 pattern8 = re.compile(p8)

 pattern9 = re.compile(p9)

 pattern10 = re.compile(p10)

 fr = open(filename)

 temp = ();

 flag = 0

 for line in fr.readlines():

     matcher1 = re.findall(pattern1,line)

     matcher2 = re.findall(pattern2,line)

     matcher3 = re.findall(pattern3,line)

     matcher4 = re.findall(pattern4,line)

     matcher5 = re.findall(pattern5,line)

     matcher6 = re.findall(pattern6,line)

     matcher7 = re.findall(pattern7,line)

     matcher8 = re.findall(pattern8,line)

     matcher9 = re.findall(pattern9,line)

     matcher10 = re.findall(pattern10,line)

     #print matcher

     w2 = open(ss+'b2_%s.csv'%year,'a')#a代表追加 w代表重写

     if (matcher1!=[]):

         for g in matcher1:

             flag = 1

             temp = g

     if ((matcher2!=[])and(flag ==1 or 2)):

         flag = 2

         w2.write("\n"+temp+",")

         for j in matcher2:

             for k in j:

                 w2.write(k)

     if ((matcher3!=[])and(flag ==2)):

         flag = 3

         w2.write(",")

         for j in matcher3:

             for k in j:

                 w2.write(k)

         #复合的缺省为0000

         w2.write(",0000")

     if ((matcher4!=[])and(flag ==3)):

         flag = 4

         w2.write(",")

         for j in matcher4:

             for k in j:

                 w2.write(k)

         #增加固定列year

         w2.write(","+year)

     if ((matcher5!=[])and(flag ==4)):

         flag = 5

         w2.write(",")

         for j in matcher5:

             for k in j:

                 w2.write(k)

         w2.write(", ")

     # print len(matcher6)

     if(len(matcher6)==1 and matcher6!=[''] ):

         flag = 6

         w2.write("\n"+temp+",")

         for j in matcher6:

             for k in j:

                 w2.write(k)

         #单独的缺省为C000

         w2.write(",C000")

     if ((matcher7!=[])and(flag ==6)):

         flag = 7

         w2.write(",")

         for j in matcher7:

             for k in j:

                 w2.write(k)

     if ((matcher8!=[])and(flag ==7)):

         flag = 8

         w2.write(",")

         for j in matcher8:

             for k in j:

                 w2.write(k)

         #增加固定列year

         w2.write(","+year)

     if ((matcher9!=[])and(flag ==8)):

         flag = 9

         w2.write(",")

         for j in matcher9:

             for k in j:

                 w2.write(k)

     if ((matcher10!=[])and(flag ==9)):

         flag = 10

         w2.write(",")

         for j in matcher10:

             for k in j:

                 w2.write(k)

     w2.close( )

 """

 特殊情况

 """

b2_trsd_EDSD_new的更多相关文章

随机推荐

nginx访问静态文件配置
通过nginx访问静态文件配置,均是在server模块中配置,有两种方式: 1.alias 通过alias关键字,重定义路径,如 server{ listen 7001; server ...
【干货】国外程序员整理的 C++ 资源大全(转)
转zi:http://www.csdn.net/article/2014-10-24/2822269-c++ 关于 C++ 框架.库和资源的一些汇总列表,由 fffaraz发起和维护. 内容包括:标准 ...
如何勾选 servlet如何获取？
1.jsp中checkbox <form action="Test"> <% for(int i = 0 ; i < 10 ; i++){ %> &l ...
pyspark dataframe 格式数据输入做逻辑回归
该方法好处是可以调节阈值,可调参数比其他形式模型多很多. [参照]http://blog.csdn.net/u013719780/article/details/52277616 [3种模型效果比较: ...
Gson转换时,Double转式化
package com.mall.core; import java.lang.reflect.Type; import java.text.DecimalFormat; import com.goo ...
ROC曲线和AUC值（转）
http://www.cnblogs.com/dlml/p/4403482.html 分类器性能指标之ROC曲线.AUC值一 roc曲线 1.roc曲线:接收者操作特征(receiveroperat ...
zabbix超级乱码解决问题
个人而言,网上那些方法并不顶什么用,研究了一番总结出了自己的一个方法. 像这种,出现了严重乱码,也不是像网上说的那样把楷体复制过去就好.事实证明我复制过去好多次了,然而并没有什么用. 下面是我自己总结 ...
Haddop SHUTDOWN_MSG: Shutting down NameNode at java.net.UnknownHostException: process01: process01: unknown error
SHUTDOWN_MSG: Shutting down NameNode at java.net.UnknownHostException: process01: process01: unknown ...
php去除bom
<?php /*检测并清除BOM*/ if(isset($_GET['dir'])){ $basedir=$_GET['dir']; }else{ $basedir = '.'; } $auto ...
iOS - OC - 网络请求 - 中文转码
#import "ViewController.h" @interface ViewController () @end @implementation ViewControlle ...

b2_trsd_EDSD_new

b2_trsd_EDSD_new的更多相关文章

随机推荐

热门专题