python3 把excel文件合并并保存到csv文件

　　具体是这样，某路径下有很多 excel文件，文件名中包含相同关键字的是一类文件，把包含相同关键字的文件合并成一个文件，生成一个新的csv文件

# coding=utf-8

import xlrd

import xlwt

import datetime

import os

import time

import httplib2

# 具体是这样，某路径下有很多 excel文件，文件名中包含相同关键字的是一类文件，把包含相同关键字的文件合并成一个文件，生成一个新的csv文件

class csvFile:

    def WriteLog(self, message, fileName):

        with open(fileName, 'a') as f:

            f.write(message)

    def combinExcelToCsv(self,keyword_list,mainExceldir = "D:\\work\\Excel_txtProcesss\\new-微博",csvDir="D:\\work\\Excel_txtProcesss\\new-微博-合并"):

        # 把文件名中包含上述文件列表的文件合并成一个文件，比如最新微博-new77723-长城.xls和最新微博-new60000-长城.xls 合并成一个文件：长城.csv

        key_filelist_dict = {}

        for root, dirs, files in os.walk(mainExceldir):

            for key in keyword_list:

                filelist = []

                for file in files:

                    strfilename = mainExceldir + "\\" + file

                    if file.find(key) > -1:

                        filelist.append(strfilename)

                if len(filelist) > 0:

                    key_filelist_dict[key] = filelist

        for key1 in key_filelist_dict.keys():

            filename = os.path.join(csvDir, key1 + ".csv")

            file_list = key_filelist_dict[key1]

            file_index = 0

            for file in file_list:

                print(file)

                try:

                    data = xlrd.open_workbook(file)

                    table = data.sheets()[0]

                    nrows = table.nrows

                    ncols = table.ncols

                    # 文件标题

                    if file_index==0:

                        rowValues = table.row_values(0)

                        headtitle = ""

                        for colIndex  in range(0,ncols):

                            headtitle += str(rowValues[colIndex])+","

                        self.WriteLog(headtitle, filename)

                    file_index+=1

                    for i in range(1, nrows):

                        rowValues = table.row_values(i)

                        message = ""

                        for colIndex in range(0, ncols):

                            message += str(rowValues[colIndex]).replace(",", "，") + ","

                        print(i)

                        message = message.replace("\n", "")

                        message = message.encode("gbk", "ignore").decode("gbk")

                        self.WriteLog("\n"+message, filename)

                except UnicodeDecodeError as rr:

                    print("error:" + file)

                    print(rr.args)

obj = csvFile()

keyword_list = ["BOSS直聘", "VIVO", "蒙牛", "宝马", "拼多多", "OPPO", "上汽通用", "小米", "优信", "长城", "", "百威", "东风", "东鹏",

                "富连网", "链家", "青岛", "一汽大众", "梅赛德斯-奔驰"]

# 存放excel文件路径

mainExceldir="D:\\work\\Excel_txtProcesss\\new-微博"

# 要生成的csv文件路径

csvDir="D:\\work\\Excel_txtProcesss\\new-微博-合并"

obj.combinExcelToCsv(keyword_list,mainExceldir)

python3 把excel文件合并并保存到csv文件的更多相关文章

python爬取当当网的书籍信息并保存到csv文件
python爬取当当网的书籍信息并保存到csv文件依赖的库: requests #用来获取页面内容 BeautifulSoup #opython3不能安装BeautifulSoup,但可以安装Bea ...
使用scrapy爬取的数据保存到CSV文件中，不使用命令
pipelines.py文件中 import codecs import csv # 保存到CSV文件中 class CsvPipeline(object): def __init__(self): ...
使用pandas中的raad_html函数爬取TOP500超级计算机表格数据并保存到csv文件和mysql数据库中
参考链接:https://www.makcyun.top/web_scraping_withpython2.html #!/usr/bin/env python # -*- coding: utf-8 ...
将一个命令的输出保存到CSV文件
执行段: 结果段: 补充:配合不同的命令可以使工作更加简单使用Imort-Csv命令从文件中导入结构化数据
C# 一些代码小结--datGirdView 保存到csv文件
if (dataGridView1.Rows.Count == 0) { MessageBox.Show("No data available!", "Prompt&qu ...
多种方法爬取猫眼电影Top100排行榜,保存到csv文件,下载封面图
参考链接: https://blog.csdn.net/BF02jgtRS00XKtCx/article/details/83663400 https://www.makcyun.top/web_sc ...
记录python爬取猫眼票房排行榜(带stonefont字体网页),保存到text文件,csv文件和MongoDB数据库中
猫眼票房排行榜页面显示如下: 注意右边的票房数据显示,爬下来的数据是这样显示的: 网页源代码中是这样显示的: 这是因为网页中使用了某种字体的缘故,分析源代码可知: 亲测可行: 代码中获取的是国内票房榜 ...
iOS开发——数据持久化&本地数据的存储（使用NSCoder将对象保存到.plist文件）
本地数据的存储(使用NSCoder将对象保存到.plist文件) 下面通过一个例子将联系人数据保存到沙盒的“documents”目录中.(联系人是一个数组集合,内部为自定义对象). 功能如下: ...
np.savetxt()——将array保存到txt文件，并保持原格式
问题:1.如何将array保存到txt文件中?2.如何将存到txt文件中的数据读出为ndarray类型? 需求:科学计算中,往往需要将运算结果(array类型)保存到本地,以便进行后续的数据分析. 解 ...

随机推荐

sublime3176注册码破解汉化及常用插件
官方网站下载地址:https://www.sublimetext.com/3 破解软件下载地址:https://www.lanzous.com/i1a7zfi 破解软件下载地址备用:https://d ...
BZOJ.3771.Triple(母函数 FFT 容斥)
题目链接 \(Description\) 有\(n\)个物品(斧头),每个物品价值不同且只有一件,问取出一件.两件.三件物品,所有可能得到的价值和及其方案数.\((a,b),(b,a)\)算作一种方案 ...
Alpha 冲刺报告8
组长:吴晓晖今天完成了哪些任务: maven和idea用的不熟啊,jar包或者war包导出来一直有问题:生气了把ide扔到服务器里去运行springboot了,卡哭了,终于可以运行了,然后debug ...
Hihocoder #1082 : 然而沼跃鱼早就看穿了一切暴力
时间限制:1000ms 单点时限:1000ms 内存限制:256MB 描述 fjxmlhx每天都在被沼跃鱼刷屏,因此他急切的找到了你希望你写一个程序屏蔽所有句子中的沼跃鱼(“marshtomp”,不区 ...
Vue集成腾讯地图和几何库
关于Vue中如何引入腾讯地图,百度搜索中的结果已经非常明确: /** * 腾讯地图. * @param key * @returns {Promise<any>} * @construct ...
PHP获取文件大小详解
通过PHP filesize函数可直接获取文件大小(单位字节),如:filesize('test.png') echo filesize('test.png'); 查看test.png图片属性: 文件 ...
SQL2008″Unable to read the list of previously registered servers on this system”
打开SQL2008,弹出”Unable to read the list of previously registered servers on this system”错误, 微软官方的解决方法:h ...
.NET的堆和栈03,引用类型对象拷贝以及内存分配
在" .NET的堆和栈01,基本概念.值类型内存分配"中,了解了"堆"和"栈"的基本概念,以及值类型的内存分配.我们知道:当执行一个方法的时 ...
转如何在IOS设备中去掉屏幕上的status bar
引入如何在IOS设备中去掉屏幕上的status bar,即:不显示设备上方的［网络.时间.电池??］条?操作方法一:在-info.list项目文件中,加上“Status bar is initiall ...
追MM和Java的23种设计模式
我在Java论坛看到这篇文章,作者以轻松的语言比喻了java的32种模式,有很好的启发作用,但可惜没有给出具体的意思,我就在后边加上了.这些都是最简单的介绍,要学习的话建议你看一下阎宏博士的<J ...

python3 把excel文件合并并保存到csv文件

python3 把excel文件合并并保存到csv文件的更多相关文章

随机推荐

热门专题