##########################################################################

循环读取该目录下所有子目录和子文件

#########################################################################

import os

import os.path

def directory(rootdir):                                  # 指明被遍历的文件夹

for parent,dirnames,filenames in os.walk(rootdir):   #三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字

for dirname in  dirnames:                        #输出文件夹信息

print "parent is:" + parent

print "dirname is:" + dirname

for filename in filenames:

print "parent is:" + parent                  #输出文件夹信息

print "filename is:" + filename              #输出文件信息

print "the full name of the file is:" + os.path.join(parent,filename)  #输出文件路径信息

directory('G:\\test')

###############################################################################

保存图片//修改图片长宽比情况

###############################################################################

from PIL import Image

def modifysize(infile,outfile):    #输入文件,输出文件

im = Image.open(infile)

(x,y) = im.size                #read image size,读取文件大小

x_s = 600                                         #define standard width,定义标准

y_s = 600                                              #calc height based on standard width

out = im.resize((x_s,y_s),Image.ANTIALIAS)                   #resize image with high-quality

out.save(outfile)

modifysize(' G:\\test\\one.jpg ', ' G:\\TEST\\one.jpg ')

from PIL import Image

def save(infile,outfile):    #输入文件,输出文件

im = Image.open(infile)

(x,y) = im.size                #read image size,读取文件大小

x_s = x                                                   #define standard width,定义标准

y_s = y                                         #calc height based on standard width

out = im.resize((x_s,y_s),Image.ANTIALIAS)                   #resize image with high-quality

out.save(outfile)

########################################################################

对文件夹中所有文件重命名函数

########################################################################

####################原来函数############################################

import os

def rename():

path=r'G:\TEST'

filelist=os.listdir(path)#该文件夹下所有的文件(包括文件夹)

for files in filelist:#遍历所有文件

Olddir=os.path.join(path,files);#原来的文件路径

if os.path.isdir(Olddir):#如果是文件夹则跳过

continue;

filename=os.path.splitext(files)[0];#文件名

filetype=os.path.splitext(files)[1];#文件扩展名

Newdir=os.path.join(path,filename[0]+filetype);#新的文件路径

os.rename(Olddir,Newdir);#重命名

rename()

#####################修改后函数###########################################

import os

def rename(path,foldername):         #传入路径和文件夹名

if len(foldername)!=5 and not(foldername.isdigit()):           #传入文件夹名是五位数的且字符串全为数值,不符合跳过

return

filelist=os.listdir(path)#该文件夹下所有的文件(包括文件夹)

i=0

for files in filelist:#遍历所有文件

Olddir=os.path.join(path,files);#原来的文件路径

if os.path.isdir(Olddir):#如果是文件夹则跳过

continue;

filename=os.path.splitext(files)[0];#文件名

filetype=os.path.splitext(files)[1].lower();#文件扩展名

if filetype!='.jpg':

filetype='.jpg'

number='%d' %i

Newdir=os.path.join(path,foldername+number+filetype);#新的文件路径,新名称命名规则

os.rename(Olddir,Newdir);#重命名

i=i+1

rename('G:\\TEST\\20010','20010')

###############################################################

#########################################################################

实现查找__过滤掉不需要的__修改大小写功能(每个文件一行一行读取)

#########################################################################

# -*- coding: utf-8 -*-

"""

Created on Fri Feb 17 20:25:05 2017

@author: who

"""

import chardet

import os

import os.path

import re

import random

import string

rootdir=r'G:\TEST'

from PIL import Image

################保存图片,从一个文件夹到另一个文件夹##############

def save(infile,outfile):    #输入文件,输出文件

im = Image.open(infile)

(x,y) = im.size                #read image size,读取文件大小

x_s = x                                                   #define standard width,定义标准

y_s = y                                         #calc height based on standard width

out = im.resize((x_s,y_s),Image.ANTIALIAS)                   #resize image with high-quality

out.save(outfile)

################过滤掉不需要的,修改大小写功能#####################

for parent, dirnames, filenames in os.walk(rootdir):   # 三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字

try:

for filename in filenames:

filenamepre=os.path.splitext(filename.decode("gbk"))[0];#文件名前缀

filetype=os.path.splitext(filename.decode("gbk"))[1].lower();#文件扩展名

pswpath = os.path.join(parent, filename.decode("gbk"));

tmppath = os.path.join(r'G:\test',filename.decode("gbk")) #写到另一个文件夹#

if filetype=='XXX':                      ####符合类型的文件####

tmp_file = open(tmppath, "w")

with open(pswpath) as f:

lines = f.readlines()

for line in lines:                  ####一行一行读取 ####

if line.find('aaa') > -1:         ####过滤掉含有aaa的这行####

continue

if line.find('CCC')>-1:          ####将含有CCC这行小写化####

tmp_file.write(line.lower())

else:

tmp_file.write(line)

tmp_file.close()

else:

save(pswpath,tmppath);

except IOError:

pass

#############################################################################

将所有文件所有文件名记录下来,进行随机分配

############################################################################

# -*- coding: utf-8 -*-

"""

Created on Fri Feb 17 15:53:34 2017

@author: who

"""

# -*- coding: utf-8 -*-

"""

Created on Wed Feb 15 18:07:03 2017

@author: Administrator

"""

import chardet

import os

import os.path

import re

import random

import string

from PIL import Image

rootdir=r'G:\TEST';    # 指明被遍历的文件夹

dict={};

dictfileold={};

dictfileoldfile={};

dictparent={};

dir={}

i=0;

for parent,dirnames,filenames in os.walk(rootdir):         #三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字

j=0

try:

for filename in filenames:                         #输出文件信息

filenamepre=os.path.splitext(filename)[0];     #文件名前缀

filetype=os.path.splitext(filename)[1].lower();#文件扩展名

tmpstr=parent.rsplit('\\')

fulloldname=os.path.join(parent,filename);

dict[filenamepre]=i;                           #旧名称为key

dictfileold[i]=fulloldname;                    #旧路径名称为value

dictfileoldfile[i]=filenamepre;                #旧文件名为value

dictparent[i]=parent;

dir[i]=tmpstr[-1]                              #得到上一级目录

i=i+1;

j=j+1;

except IOError:

pass

##############文件数,进行随机分配##########################################

foldernum=i;

randomnum=range(foldernum);

random.shuffle(randomnum);

trainnum=int(foldernum*0.7);

train=open(r'G:\train.txt','w')

val=open(r'G:\val.txt','w')

trainval=open(r'G:\trainval.txt','w')

for j in range(0,foldernum):

trainval.write(dictfileoldfile[j])

trainval.write('\n')

if j in randomnum[0:trainnum]:

train.write(dictfileoldfile[j])

train.write('\n')

else:

val.write(dictfileoldfile[j])

val.write('\n')

train.close()

val.close()

trainval.close()

############################################################################

找到符合要求的文件,进行随机分配

  • 编号要以6为数字命名,例如000034.jpg
  • 图片要是JPEG/JPG格式的,PNG之类的需要自己转换下
  • 图片的长宽比(width/height)要在0.462-6.828之间,就是太过瘦长的图片不要

############################################################################

# -*- coding: utf-8 -*-

"""

Created on Wed Feb 15 18:07:03 2017

@author: Administrator

"""

import chardet

import os

import os.path

import re

import random

import string

from PIL import Image

def save(infile,outfile):    #输入文件,输出文件

im = Image.open(infile)

(x,y) = im.size                #read image size,读取文件大小

x_s = x                                                   #define standard width,定义标准

y_s = y                                         #calc height based on standard width

out = im.resize((x_s,y_s),Image.ANTIALIAS)                   #resize image with high-quality

out.save(outfile)

def modifysize(infile,outfile):    #输入文件,输出文件

try:                           #过滤掉任意的异常

im = Image.open(infile)

except :

return 0

(x,y) = im.size                #read image size,读取文件大小

x_s = 800                                         #define standard width,定义标准

y_s = 600

try:                                            #过滤掉任意的异常

out = im.resize((x_s,y_s),Image.ANTIALIAS)

except :

return 0

out.save(outfile)

return 1

rootdir=r'E:\TEST';             # 指明被遍历的文件夹

dict={};

dictfilenew={};

dictfileold={};

dictfilenewname={};

dictparent={};

dir={}

i=0;

for parent,dirnames,filenames in os.walk(rootdir):         #三个参数:分别返回1.父目录 2.所有文件夹名字(不含路径) 3.所有文件名字

j=0

try:

for filename in filenames:                                      #输出文件信息

if((re.search(u'XXX',filename.decode("gbk"))==None):   #找到符合要求文件名

continue;

filenamepre=os.path.splitext(filename.decode("gbk"))[0];#文件名前缀

filetype=os.path.splitext(filename.decode("gbk"))[1].lower();#文件扩展名

if (filetype!='.jpg' and filetype!='.png'):        ##符合相应后缀的图片

continue;

tmpstr=parent.rsplit('\\')

print u"上层目录:"+tmpstr[-1]

if len(tmpstr[-1])!=5 or not(tmpstr[-1].isdigit()):           #传入文件夹名是五位数的且字符串全为数值,不符合跳过

continue

fullname=os.path.join(parent,filename.decode("gbk"));

if filetype!='.jpg':

filetype='.jpg'

number='%d' %j

Newname=tmpstr[-1]+number+filetype

Newdir=os.path.join(parent,tmpstr[-1]+number+filetype);              #新的文件路径,新名称命名规则

fullnewname=os.path.join(parent,Newname.decode("gbk"));       #将所有新路径名称,旧路径名称,新名称,旧名称,上一级目录都用字典保存

fulloldname=os.path.join(parent,filename.decode("gbk"));

dict[fullnewname]=i;        #新路径名称为key

dictfilenew[i]=fullnewname;  #新路径名称为value

dictfileold[i]=fulloldname;   #旧路径名称为value

dictfilenewname[i]=Newname.decode("gbk");  #新名称为value

dictparent[i]=parent;

dir[i]=tmpstr[-1]

i=i+1;

j=j+1;

except IOError:

pass

###########################将所有文件随机分配##################################

foldernum=i;

randomnum=range(foldernum);

random.shuffle(randomnum);

trainnum=int(foldernum*0.8);

for j in range(0,foldernum):

if j in randomnum[0:trainnum]:

outfile=os.path.join(r'E:\train',dictfilenewname[j])

modifysize(dictfileold[j],outfile)

else:

outfile=os.path.join(r'E:\test',dictfilenewname[j])

modifysize(dictfileold[j],outfile)

python的N个小功能(找到符合要求的图片,重命名,改格式,缩放,进行随机分配)的更多相关文章

  1. python的N个小功能(找到要爬取的验证码链接,并大量下载验证码样本)

    # -*- coding: utf-8 -*- """ Created on Mon Mar 21 11:04:54 2017 @author: sl "&qu ...

  2. Python 入门学习(贰)文件/文件夹正则表达式批量重命名工具

    基于 Udacity 的 Python 入门课程 Programming Foundations with Python 基于 Python 2.7 思路 Project 2 是一个去除文件名中所有数 ...

  3. python的N个小功能(文件内容的匹配替换)

    # -*- coding: utf-8 -*- """ Created on Fri Feb 17 20:25:05 2017 @author: who "&q ...

  4. python的N个小功能(图片预处理:打开图片,滤波器,增强,灰度图转换,去噪,二值化,切割,保存)

    ############################################################################################# ###### ...

  5. python的N个小功能(连接数据库并下载相应位置的图片)

    #################################################################################################### ...

  6. python的N个小功能(高斯模糊原理及实践)

    原理: 二维高斯函数 1)         为了计算权重矩阵,需要设定σ的值.假定σ=1.5,则模糊半径为1的权重矩阵如下: 2)         这9个点的权重总和等于0.4787147,如果只计算 ...

  7. python的N个小功能(文本字段对应数值,经纬度计算距离,两个时间点计算时间间隔)

    案例1 >>> import pandas as pd >>> df=pd.DataFrame({'A':[1,2,3],'B':[1,2,3],'C':[1,2, ...

  8. python的N个小功能之正则匹配

    1.. 匹配任意除换行符“\n”外的字符:2.*表示匹配前一个字符0次或无限次:3.+或*后跟?表示非贪婪匹配,即尽可能少的匹配,如*?重复任意次,但尽可能少重复,惰性匹配:4. .*? 表示匹配任意 ...

  9. python的N个小功能(更新文件)

    ########################################################################## #对于第二份文件:第一份与第二份不相同,以第二份为 ...

随机推荐

  1. 20155322 2016-2017-2《Java程序设计》课程总结

    学号 2016-2017-2<Java程序设计>课程总结 (按顺序)每周作业链接汇总 预备作业一:浅谈对师生关系的看法以及对未来学习生活的展望 预备作业二:学习娄老师<做中学> ...

  2. # 20155337 2017-2018-1 《信息安全系统设计基础》第二周课堂实践+myod

    20155337 2017-2018-1 <信息安全系统设计基础>第二周课堂实践+myod 因为在课上已经提交了四个实验,还欠缺最后一个实验,反省一下自己还是操作不熟练,平时在课下应该多多 ...

  3. 在azure windows虚拟机上安装iis

    在 dashboard-添加角色和功能-一直往下点就好了,后”选择安装类型“页面 中选择[基于角色或基于功能的安装],安装完成后 在浏览器输入 http://localhost/ 就可以正常访问网站了 ...

  4. sqoop 数据迁移

    sqoop 数据迁移 1 概述 sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具. 导入数据:MySQL,Oracle导入数据到Hadoop的HDFS.HIVE.H ...

  5. web中简单wcf的创建和应用

    以前做过wcf控制台作为宿主,今天回顾一下,不过公司用的web直接创建就把这种过程写下来. 第一步:创建wcf页面如图 第二步:创建wcf时候已经自动生成了接口(契约)和实现类(契约),但是我们可以修 ...

  6. 自己动手做AI:Google AIY开发工具包解析

    2018年国际消费性电子展(CES)上,最明显的一个趋势是Amazon与Google的语音技术进驻战,如AmazonAlexa进驻到Acer笔电内,Google Assist进驻到KIA汽车内,其他如 ...

  7. js判断PC端 移动端 并跳转到对应页面

    一.PC端跳转到移动端 html页面: <script>var webroot="/",catid="{$catid}",murl="m/ ...

  8. Oracle和MySQL在使用上的区别

    1.  Oracle是大型数据库而MySQL是中小型数据库,MySQL是开源的而Oracle的价格非常高. 2.  Oracle支持大并发,大访问量. 3.  安装所用的空间差别也是很大,MySQL安 ...

  9. html页面中完成查找功能

    最近在搞一个被很多人改了的框架,天天看代码看的头的晕了,不过感觉进步还挺大的,自己做了一个后台可配置前台查看两个库不同数据范围的东西,还挺满意,那天拿出来分享一下,今天先说一个这几天做的功能,就是ht ...

  10. mongodb4简明笔记

    就一数据库,掌握基本用法,其他的现学现卖就行了. 所以要把握基本套路. 创建数据库=>使用数据库=>创建集合=>使用集合=>创建文档=>使用文档 1.数据库 mongod ...