package com.hudong.util.orther;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.List; import org.apache.commons.io.FileUtils;
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader; /**
* 遍历文件
*
* @Title: ErgodicFile.java
* @Copyright: Copyright (c) 2005
* @Description: <br>
* <br>
* @Company: ***
 * @Created on 2013-8-15 上午9:41:20
* @author 杨凯
*/
public class JudgeCopyErgodicFile { private static int k = 1, m = 1; private final static Log logger = LogFactory.getLog(JudgeCopyErgodicFile.class); public static void main(String[] args) throws IOException { File file = new File("E:/公司资料/39网资料/最终xml数据");
ergodicFolder(file);
} public static void ergodicFolder(File file) throws IOException { File[] fileList = file.listFiles(); for (int i = 0; i < fileList.length; i++) { // 遍历文件
if (fileList[i].isFile()) { // 判断是文件
// 这里是必须的,一定要休眠,否则会导致文件的覆盖
try {
Thread.sleep(1l);
} catch (InterruptedException e) {
e.printStackTrace();
}
if ("summary.xml".equals(fileList[i].getName())) {
try {
List<Element> root = new SAXReader().read(new FileInputStream(fileList[i])).getRootElement().elements();
for (Element e : root) {
String content = e.element("SUMMARY_CONTENT").getTextTrim();
if (!"".equals(content)) {
File summaryFile = new File("E:/yiyuan/summary/" + k + "/");
summaryFile.mkdir();
FileUtils.copyFile(fileList[i], new File(summaryFile.getAbsolutePath() + "/" + System.currentTimeMillis() + ".xml"));
m++;
if (m > 1000) {
k++;
m = 1;
}
} else {
logger.info(e.element("DOC_TITLE").getText());
System.out.println(e.element("DOC_TITLE").getText());
}
}
} catch (DocumentException e1) {
e1.printStackTrace();
}
} else if ("content.xml".equals(fileList[i].getName())) {
File contentFile = new File("E:/yiyuan/docinfo/" + k + "/" + System.currentTimeMillis());
contentFile.mkdir();
File desFile = new File(contentFile.getAbsolutePath() + "/docInfo.xml");
FileUtils.copyFile(fileList[i], desFile);
m++;
if (m > 1000) {
k++;
m = 1;
}
}
} else if (fileList[i].isDirectory()) { // 判断是目录
ergodicFolder(fileList[i]); // 递归
}
}
}
}

一个自动递增生成目录和文件的cop文件类的更多相关文章

  1. MongoDB自动递增序列

    MongoDB没有像SQL数据库外开箱即用自动递增功能.默认情况下,它采用了12字节的ObjectId为_id字段作为主键来唯一地标识文档.然而,可能存在的情况,我们可能希望_id字段有一些其它的自动 ...

  2. 使用dotnet build时复制引用dll到生成目录

    默认配置下dotnet build只会输出项目代码的dll,依赖用的是dotnet缓存中的dll,只有dotnet publish才会把依赖的dll一起输出到生成目录. 在项目csproj文件中添加以 ...

  3. 文件夹操作-DirectoryInfo类

    DirectoryInfo类是一个密封类,它可以用来创建.移动.枚举目录和子目录.DirectoryInfo类包括4个属性,可以用来获取目录的名称.父目录等. DirectoryInfo类的属性表 属 ...

  4. Python实现插件机制——自动import一个目录下的所有.py文件

    假设有这样一个目录结构: /src          main.py          /plugins                __init__.py                a.py  ...

  5. 用React实现一个自动生成文章目录的组件

    原文地址:小寒的博客 功能介绍 这个组件的效果呐,就是你在浏览这个页面的时候点击右上角的叉叉看到的那个文章目录. 功能很简单,就是根据文章内容自动生成这个目录,可以快速跳转. 需要的知识点 正则 do ...

  6. 使用mybatis-generator自动生成model、dao、mapping文件

    参考文献:http://www.cnblogs.com/smileberry/p/4145872.html 一.所需库 1.mybatis-generator库 2.连接DB的驱动(此以mysql为例 ...

  7. 在/proc文件系统中增加一个目录hello,并在这个目录中增加一个文件world,文件的内容为hello world

    一.题目 编写一个内核模块,在/proc文件系统中增加一个目录hello,并在这个目录中增加一个文件world,文件的内容为hello world.内核版本要求2.6.18 二.实验环境 物理主机:w ...

  8. 安装doxygen(一个自动文档生成工具)+Graphviz图形可视化软件

    参考文章: http://www.fmddlmyy.cn/text21.html http://www.cnblogs.com/duguguiyu/archive/2008/06/29/1231852 ...

  9. 如何使用ThinkPHP5 ,自动生成目录?

    具体步骤: A.在build.php中按照实际需求修改定义模块的内容: B.修改Public/index.php,在代码中加入: // 读取自动生成定义文件 $build = include '/.. ...

随机推荐

  1. 零相关|回归|相关|相关系数|回归解释相关|r判断相关性|相关系数的区间估计|数据类型|非线性回归

    零相关是什么? 零相关亦称“不相关”.相关的一种.两个变量的相关系数r=0时的相关.零相关表示两个变量非线性相关,这时两个变量可能相互独立,也可能曲线相关.对于正态变量,两个变量零相关与两个变量相互独 ...

  2. 浅谈那些你不知道的C艹语法

    C艹实践中的超神语法 pragma 卡常必备QAQ #pragma GCC optimize(2) #pragma GCC optimize(3) #pragma GCC optimize(" ...

  3. mongodb 批量改变某一列类型 比如 String改为double,insert into select 批量插入 批量修改

    //type:2代表String 1.String变Double db.集合.find({"列":{$type:2}}).forEach(function(x){ x.列=pars ...

  4. 磁力搜索导航,MagnetW将搜索结果格式化统一显示

    简介 magnetW基于magnetX的规则原理,将各个磁力站的搜索结果统一格式化 安装 从Github Releases或者Github Wiki下载对应平台 3.1.1 更新了一批规则 支持Soc ...

  5. 【iOS学习笔记】UITextField中的输入检测——限制只能输入数字和小数点

    最近趁着放假时间,在看The Big Nerd Ranch的iOS编程,想着重新复习一遍iOS开发的基础知识 于是从这一篇开始记录一些学习过程中遇到的小问题 书中第四章有一个温度转换的app实现,整体 ...

  6. 懒人JS

    1.文本框只能输入数字代码(小数点也不能输入) <input onkeyup="this.value=this.value.replace(/\D/g,'')" onafte ...

  7. 当年写的C代码

    #ifndef KMIN_H_ #define KMIN_H_ /******************************************************************* ...

  8. $n$阶常微分方程通解中常数独立的意义

    丁同仁,李承治编<常微分方程教程>第二版的定义1.3给出了 $ n$ 阶常微分方 程 $ {\displaystyle F(x,y,y',\cdots,y^{(n)})=0 \ \ \ \ ...

  9. 求Fibonacii数列的第40个数

    public class Fibonacii{ public int m1(int n){ if(n == 1||n == 2){ return 1; } return m1(n-1) + m1(n- ...

  10. CentOS7部署yum环境及虚拟机快照克隆

    CentOS部署IP地址 第一种:nmtui        方向键.tab.空格.回车第二种:修改网卡配置文件         /etc/sysconfig/network-sripts/ifcfg- ...