最完整的合并相交集合的Java代码（查并集）

这个是自己写的算法，如果有大牛，麻烦帮我并行化。初学者则可以学到不少东西。

产生测试用例

import java.io.*;

import java.util.Random;

public class ProduceCase {

    public static void main(String[] argvs){

        File file2 = new File("D:\\YounG\\TestCases\\MySet\\test.txt");

        FileWriter fw = null;

        BufferedWriter writer = null;

        try {

            fw = new FileWriter(file2);

            writer = new BufferedWriter(fw);

            for(int i = 0; i < 500000; i++){

                StringBuilder stringBuilder = new StringBuilder();

                Random random = new Random();

                for(int j = 0; j < random.nextInt(21); j++){

                    String s = getRandomString();

                    if(" ".equals(s)&&s.isEmpty()) continue;

                    stringBuilder.append(s + " ");

                }

                writer.write(stringBuilder.toString());

                writer.newLine();//换行

            }

            writer.flush();

        } catch (FileNotFoundException e) {

            e.printStackTrace();

        }catch (IOException e) {

            e.printStackTrace();

        }finally{

            try {

                writer.close();

                fw.close();

            } catch (IOException e) {

                e.printStackTrace();

            }

        }

    }

    public static String getRandomString( ) { //length表示生成字符串的长度

        Random random = new Random();

        StringBuilder sb = new StringBuilder();

        int length = random.nextInt(10);

        for (int i = 0; i < length; i++) {

            int number = random.nextInt(26);

            sb.append(String.valueOf((char) (number+65) ));

        }

        return sb.toString();

    }

}

　　合并集合：

import java.io.*;

import java.util.*;

public class MapTest {

    public static void main(String[] argvs) {

        File file = new File("D:\\YounG\\TestCases\\MySet\\test.txt");

        BufferedReader reader = null;

        List<HashSet> mySets = new ArrayList<>(500000);

        boolean hasEmpty = false;

        try {

            reader = new BufferedReader(new FileReader(file));

            String tempString;

            // 一次读入一行，直到读入null为文件结束

            while ((tempString = reader.readLine()) != null) {

                // 显示行号

                Scanner scanner = new Scanner(tempString);

                HashSet<String> mySet = new HashSet<>();

                mySet.clear();

                while (scanner.hasNext()) {

                    mySet.add(scanner.next());

                }

                scanner.close();

                //对个集合内部进行排序，定义大小。放弃排序。

                if (mySet.isEmpty() && !hasEmpty) hasEmpty = true;

                else

                    mySets.add(mySet);

            }

            reader.close();

        } catch (IOException e) {

            e.printStackTrace();

        } finally {

            if (reader != null) {

                try {

                    reader.close();

                } catch (IOException e1) {

                }

            }

        }

        List<Integer> destList = new ArrayList<>(mySets.size());

        int setsSize = mySets.size();

        for (int i = 0; i < setsSize; ++i) {

            destList.add(i);

        }

        Map<String,Integer> mergeMap = new HashMap<>(1000000); //合并图。

        long startTime=System.currentTimeMillis();   //获取开始时间

        for (int setId = 0; setId < mySets.size(); ++setId) {

            Iterator<String> iterator = mySets.get(setId).iterator();

            List<String> setElem = new ArrayList<>(50);//先把元素全部迭代出来，避免了多线程错误。

            while (iterator.hasNext())

                setElem.add(iterator.next());

            int elemNumOfSet = setElem.size();

            for(int j = 0; j < elemNumOfSet; j++) {

                if( mergeMap.containsKey( setElem.get(j) ) ) {                     //判断当前元素是否包含在合并记录表里边。永远不要用直接下标访问（伪下标）

                    Integer destValueSetId = destList.get( mergeMap.get( setElem.get(j) ).intValue() );  //真实 的包含该元素的最小集合号。

                    Integer destLoopSetId = destList.get(setId);

                    if( destValueSetId.compareTo( destLoopSetId ) > 0 ) {

//                        Iterator putIterator = mySets.get(destValue).iterator();

//                        while (putIterator.hasNext())

//                            mergeMap.put((String) putIterator.next(), destList.get(setId)); //找过的元素记得入mergeMap。

                        mySets.get( destLoopSetId ).addAll( mySets.get(destValueSetId) );//Set中元素增多，所以iterator失效，故重新复制。且Hash 存储本身就是无序的，随着元素的增加是会改动存储顺序的。

                        //推测，HashSet与HashMap不同HashSet不过就是所有的Value是一个固定的地址罢了。而HashMap分为了Value和Key两个集合。

                        mySets.get( destValueSetId ).clear();

                        for (int i = 0; i < destList.size(); i++) {

                            if ( destList.get(i).equals( destValueSetId ) ) {

                                destList.set(i, destLoopSetId );

                            }

                        }

                    }

                    else if(destValueSetId.compareTo( destLoopSetId ) < 0) {

//                        Iterator putIterator = mySets.get(destValue).iterator();

//                        while (putIterator.hasNext())

//                            mergeMap.put((String) putIterator.next(), destValue); //找过的元素记得入mergeMap。

                        mySets.get( destValueSetId ).addAll( mySets.get(destLoopSetId));

                        mySets.get( destLoopSetId ).clear();

                        for (int i = 0; i < destList.size(); i++) {

                            if ( destList.get(i).equals( destLoopSetId )) {

                                destList.set(i, destValueSetId);

                            }

                        }

                    }

                }

                else {

                    mergeMap.put( setElem.get(j) , setId );   //此处切记不可用destList.get(iSet)，因为该值并不稳定。

                }

            }

        }

        long endTime=System.currentTimeMillis(); //获取结束时间

        System.out.println("程序运行时间： "+(endTime-startTime)+"ms");

        Iterator iterator = mySets.iterator();

        File file2 = new File("D:\\YounG\\TestCases\\MySet\\testACK.txt");

        FileWriter fw = null;

        BufferedWriter writer = null;

        try {

            fw = new FileWriter(file2);

            writer = new BufferedWriter(fw);

            while(iterator.hasNext()){

                HashSet<String> temp = (HashSet<String>) iterator.next();

                if(!temp.isEmpty()) {

                    writer.write( temp.toString() );

                    writer.newLine();

                }

            }

            writer.flush();

        } catch (FileNotFoundException e) {

            e.printStackTrace();

        }catch (IOException e) {

            e.printStackTrace();

        }finally{

            try {

                writer.close();

                fw.close();

            } catch (IOException e) {

                e.printStackTrace();

            }

        }

    }

}

验证输出结果：

import java.io.BufferedReader;

import java.io.File;

import java.io.FileReader;

import java.io.IOException;

import java.util.*;

import java.util.regex.Pattern;

/**

 * Created by Young on 2015/12/25.

 * 如何测试测试用例：

 * 1.所有的元素不重复，/hashSet

 * 2.元素的种类不减少，/count

 * 3.没有非法合并。（非法合并指，合并过程中，不存在共同元素依然合并），这一项适合在合并程序必然实现。

 * 3 must be true since contains and addAll execute as the same time.

 */

public class Validaty {

    public static void main(String[] args) {

        File file = new File("D:\\YounG\\TestCases\\MySet\\testACK.txt");

        BufferedReader reader = null;

        Set allSet = new HashSet<String>();

        //int count1 = 0;

        try {

            reader = new BufferedReader(new FileReader(file));

            String tempString;

            // 一次读入一行，直到读入null为文件结束

            allSet.clear();

            while ((tempString = reader.readLine()) != null) {

                // 显示行号

                tempString = tempString.substring(1,tempString.length()-1);

                //Pattern pattern = Pattern.compile(",");

                String[] strings = tempString.split(", ");

                int strj = 0;

                while (strj < strings.length && !strings[strj].isEmpty()){

                    if (allSet.contains(strings[strj])) {

                        System.out.println("Wrong ACK for \"" + strings[strj] + "\" is repeated");

                        return;

                    }

                    allSet.add(strings[strj]);

                    strj++;

                }

/*                Scanner scanner = new Scanner(tempString);

                while (scanner.hasNext()) {

                    String temp = scanner.next();

                    if (allSet.contains(temp)) {

                        System.out.println("Wrong ACK for " + temp + "is repeated");

                        return;

                    }

                    allSet.add(temp);

                    //++count1;

                }

                scanner.close();*/

            }

            reader.close();

        } catch (IOException e) {

            e.printStackTrace();

        } finally {

            if (reader != null) {

                try {

                    reader.close();

                } catch (IOException e1) {

                }

            }

        }

        File file2 = new File("D:\\YounG\\TestCases\\MySet\\test.txt");

        BufferedReader reader2 = null;

        try {

            reader2 = new BufferedReader(new FileReader(file2));

            String tempString;

            // 一次读入一行，直到读入null为文件结束

            while ((tempString = reader2.readLine()) != null) {

                // 显示行号

                Scanner scanner = new Scanner(tempString);

                while (scanner.hasNext()) {

                    String temp = scanner.next();

                    if (!allSet.contains(temp)) {

                        System.out.println("Wrong ACK for lost elem " + temp);

                        return;

                    }

                }

                scanner.close();

            }

            reader2.close();

        } catch (IOException e) {

            e.printStackTrace();

        } finally {

            if (reader != null) {

                try {

                    reader.close();

                } catch (IOException e1) {

                }

            }

        }

        System.out.println("Right ACK");

    }

}

最完整的合并相交集合的Java代码（查并集）的更多相关文章

JAVA 代码查错
1.abstract class Name { private String name; public abstract boolean isStupidName(String name){}} 大侠 ...
Java代码查错部分?
1. abstract class Name { private String name; public abstract boolean isStupidName(String name) {} } ...
java代码中后台向前台传递list或map集合案例
导入jar包新建一个servert传递map集合 ajax.java代码: package servlet; import java.io.IOException; import java.io.P ...
Android开发：《Gradle Recipes for Android》阅读笔记(翻译)3.5——在flavors间合并java代码
问题: 你想要在单独的product flavors里面增加Acitivity或者其它java类. 解决方案: 创建合适的代码目录,增加java类,将它们和main代码合并. 讨论: flavors和 ...
关于Hash集合以及Java中的内存泄漏
<学习笔记>关于Hash集合以及Java中的内存泄漏标签: 学习笔记内存泄露hash 2015-10-11 21:26 58人阅读评论(0) 收藏举报分类: 学习笔记(5) 版 ...
java集合系列——java集合概述（一）
在JDK中集合是很重要的,学习java那么一定要好好的去了解一下集合的源码以及一些集合实现的思想! 一:集合的UML类图(网上下载的图片) Java集合工具包位置是java.util.* 二:集合工具 ...
c++ 集合的增删改查，与两集合的合并缺陷（空间大小不灵活）
#if 1 #include <iostream> #include <stdlib.h> using namespace std; class List { public: ...
scala集合与java集合的转换应用
今天在业务开发中遇到需要Scala集合转为Java集合的场景: 因为业务全部是由Scala开发,但是也避免不了调用Java方法的场景,所以将此记录下来加深记忆: import scala.collec ...
C# Net 合并int集合为字符串，如：输入1,2,3,4,8 输出1~4,8
C# Net 合并int集合为字符串,如:输入1,2,3,4,8 输出1~4,8 粘贴代码使用: /// <summary> /// 合并int集合,如1,2,3,4,8 输出1~4,8 ...

随机推荐

动态jsp页面转PDF输出到页面
最近工作中遇到不少问题.总结一下.这段代码主要功能是将一个生成JSP页面转发成PDF输出到页面需要利用ITEXT String html = ServletUtils.forward(request ...
angularjs 更新局部作用域
前几天项目需要,做了一个背景遮罩的弹出框,html采用js动态添加进去的,结果发现angularjs绑定在这里面不起作用,搜索下解决了,记录下: var smallApplyParent = docu ...
ThinkPHP的数据库访问的简单操作
传统的sql与ThinkPHP中的sql相比较以user表为例 $user=M('user'); 1: SELECT * FROM user----------$user->select( ...
一个少了context的赋值的错误
错误类型如下,怎么也找不到错误,后来仔细看了源代码,原来忘了context的赋值,只是声明,声明后不马上引用到值容易出事. 11-12 15:00:09.877: E/AndroidRuntime(6 ...
getSharedPreferences()与getSharedPreferences()与getDefaultSharedPreferences()的区别
http://blog.csdn.net/ah200614435/article/details/7869681 一直迷惑于这三个方法的关系,最近忙完项目,好好的分析一下. 如果你熟悉Context那 ...
Android混淆那些事儿
博客: 安卓之家微博: 追风917 CSDN: 蒋朋的家简书: 追风917 博客园:追风917 # Android混淆 Android混淆是Android开发者经常使用的一种用于代码防止被反编译的 ...
关于wordpress中更换CKEditor编辑器
wordpress中自带的编辑器实在是功能太简,连插入表格都没有,使用插件的方式太过于麻烦,干脆就直接更换编辑器了,在网上找了一些方法,下文引自http://down.chinaz.com/try/2 ...
jstl的formatNumber标签的四舍五入问题
jstl的formatNumber标签的四舍五入问题近日使用JSTL的formatNumber 标签进行四舍五入时,发现它竟然使用的是"4舍6入5奇偶"的算法. 要实现" ...
0-C相关01:NSlog函数介绍。
NSlog()函数介绍: 首先:NSlog()函数是cocoa的框架中提供的一个方法: 下图中最上方是它在Xcode中的路径: : 同样都是输出函数.下边我们来看一下,在O-C中NSlog()和在 ...
sql server获取当前日期
SqlServer中得到当前日期(convert函数,getdate函数)函数GETDATE()的返回值在显示时只显示到秒.实际上,SQL Sever内部时间可以精确到毫秒级(确切地说,可以精确到3. ...

最完整的合并相交集合的Java代码（查并集）

最完整的合并相交集合的Java代码（查并集）的更多相关文章

随机推荐

热门专题