《Java高并发程序设计》学习 --5.7 并行搜索
2017-03-25 09:18
232 查看
对于有序数据,通常可以采用二分查找法。对于无序数据,则只能挨个查找。在本节中,我们将讨论有关并行的无序数组的搜索实现。
给定一个数组,我们要查找满足条件的元素。对于串行程序来说,只要遍历一下数组就可以得到结果。但如果要使用并行方式,则需要额外增加一些线程间的通信机制,使各个线程可以有效地运行。
一种简单的策略就是将原始数据集合按照期望的线程数进行分割。每个线程各自独立搜索,当其中一个线程找到数据后,立即返回结果即可。
现在假设有一个整数数组,我们需要查找数组内的元素:
static int[] arr;
定义线程池、线程数量以及存放结果的变量result。在result中,我们会保存符合条件的元素在arr数组中的下标。默认为-1,表示没有找到给定元素。
并发搜索会要求每个线程查找arr中的一段,因此,搜索函数必须指定线程需要搜索的起始和结束位置:
上述代码中,首先通过result判断是否已经有其他线程找到了需要的结果。如果已经找到,则立即返回不再进行查找。如果没有找到,则进行下一步搜索。第7行代码成立则表示当前线程找到了需要的数据,那么就会将结果保存到result变量中。这里使用CAS操作,如果设置失败,则表示其他线程已经先我一步找到了结果。因此,可以无视失败的情况,找到结果后,进行返回。
定义一个线程进行查找,它会调用前面的search()方法:
最后是pSearch()并行查找函数,它会根据线程数量对arr数组进行划分,并建立对应的任务提交给线程池处理:
上述代码中使用了JDK内置的Future模式,其中4~8行将原始数组arr划分为若干段,并根据划分结果建立子任务。每一个子任务都会返回一个Future对象,通过Future对象可以获得线程组得到的最终结果。在这里,由于线程之间通过result共享彼此的信息,因此只要当一个线程成功返回后,其他线程都会立即返回。因此,不会出现由于排在前面的任务长时间无法结束而导致整个搜索结果无法立即获取的情况。
注:本篇博客内容摘自《Java高并发程序设计》
给定一个数组,我们要查找满足条件的元素。对于串行程序来说,只要遍历一下数组就可以得到结果。但如果要使用并行方式,则需要额外增加一些线程间的通信机制,使各个线程可以有效地运行。
一种简单的策略就是将原始数据集合按照期望的线程数进行分割。每个线程各自独立搜索,当其中一个线程找到数据后,立即返回结果即可。
现在假设有一个整数数组,我们需要查找数组内的元素:
static int[] arr;
定义线程池、线程数量以及存放结果的变量result。在result中,我们会保存符合条件的元素在arr数组中的下标。默认为-1,表示没有找到给定元素。
public static final int THREADNUM = 2; static ExecutorService pool = Executors.newCachedThreadPool(); static AtomicInteger result = new AtomicInteger(-1);
并发搜索会要求每个线程查找arr中的一段,因此,搜索函数必须指定线程需要搜索的起始和结束位置:
public static int search(int searchValue,int beginPos,int endPos) { int i = 0; for(i=beginPos; i<endPos; i++) { if(result.get() >= 0) { return result.get(); } if(arr[i] == searchValue) { if(!result.compareAndSet(-1, i)) { return result.get(); } return i; } } return -1; }
上述代码中,首先通过result判断是否已经有其他线程找到了需要的结果。如果已经找到,则立即返回不再进行查找。如果没有找到,则进行下一步搜索。第7行代码成立则表示当前线程找到了需要的数据,那么就会将结果保存到result变量中。这里使用CAS操作,如果设置失败,则表示其他线程已经先我一步找到了结果。因此,可以无视失败的情况,找到结果后,进行返回。
定义一个线程进行查找,它会调用前面的search()方法:
public static class SearchTask implements Callable<Integer> { int begin,end,searchValue; public SearchTask(int searchValue,int begin,int end) { this.begin = begin; this.end = end; this.searchValue = searchValue; } @Override public Integer call() throws Exception { int re = search(searchValue,begin,end); return re; } }
最后是pSearch()并行查找函数,它会根据线程数量对arr数组进行划分,并建立对应的任务提交给线程池处理:
public static int pSearch(int searchValue) throws InterruptedException,ExecutionException { int subArrSize = arr.length/THREADNUM+1; List<Future<Integer>> re = new ArrayList<Future<Integer>>(); for(int i=0; i<arr.length; i+=subArrSize) { int end = i + subArrSize; if(end>=arr.length) end = arr.length; re.add(pool.submit(new SearchTask(searchValue, i, end))); } for(Future<Integer> fu : re) { if(fu.get() >= 0) return fu.get(); } return -1; }
上述代码中使用了JDK内置的Future模式,其中4~8行将原始数组arr划分为若干段,并根据划分结果建立子任务。每一个子任务都会返回一个Future对象,通过Future对象可以获得线程组得到的最终结果。在这里,由于线程之间通过result共享彼此的信息,因此只要当一个线程成功返回后,其他线程都会立即返回。因此,不会出现由于排在前面的任务长时间无法结束而导致整个搜索结果无法立即获取的情况。
注:本篇博客内容摘自《Java高并发程序设计》
相关文章推荐
- 《Java高并发程序设计》学习 --5.3 并行模式之生产者-消费者模式
- 《Java高并发程序设计》学习 --5.6 并行流水线
- 《Java高并发程序设计》学习 --1.3有关并行的两个重要定律
- 《Java高并发程序设计》学习 --5.9 并行模式之并行算法:矩阵乘法
- 《Java高并发程序设计》学习 --5.5 并行模式之 Future模式
- 《Java高并发程序设计》学习 --5.2 并行模式之不变模式
- 【Java高并发学习】Java并行搜索
- MOSS Search学习记录(二):配置爬网并尝试一个简单的搜索
- MOSS Search学习记录(三):配置搜索范围
- MOSS Search学习记录(二):配置爬网并尝试一个简单的搜索
- 学习搜索开发的重点不在lucene和nutch[ 原创]
- MOSS Search学习记录(八):高级搜索定制(中)
- 【推荐学习】Google让互联网资源免费到底,搜索各种资源
- MOSS Search学习记录(七):高级搜索定制(上)
- 搜索引擎开发,垂直搜索开发探讨:蜘蛛,并行,搜索,垂直搜索,搜索开发,lucene,java,分布[原创]
- MOSS Search学习记录(四):利用规则搜索指定文件夹的内容
- MOSS Search学习记录(五):利用元数据和规则搜索多个列表中指定范围的内容
- Google推出代码搜索 供编程人员学习之用
- 数据结构学习_图(1)深度优先搜索、广度优先搜索和最小生成树
- [转贴]Symbian编程VC开发环境设置 (方便个人学习用,转载自 rocklys的专栏,转贴请搜索原作者)