#Python打开读取一个文件内容,然后写入一个新的文件中,并对某些字段进行提取,写入新的字段的脚本,与大家共同学习. import os import re def get_filelist(dir): os.getcwd() #get current work direction. os.chdir(path) #change direction Filelist = [] for home, dirs, files in os.walk(path): for filename in fil
由数据库导出的数据是格式化数据,如下所示,每两个<REC>之间的数据是一个记录的所有字段数据,如<TITLE>.<ABSTRACT>.<SUBJECT_CODE>.但是每条记录中可能某些字段信息为空, 在导出的文本文件中,就会缺失这个字段,如记录3,缺失<ABSTRACT>这个字段,记录4,缺失<SUBJECT_CODE>这个字段. <REC>(记录1) <TITLE>=Regulation of the pr