(转)solr排序OOM解决方法
转自 http://topcat.iteye.com/blog/1293650
问题
lucene使用排序时会将被排序字段全部加入内存再进行排序,当多次使用不同字段进行排序时会造成OOM问题
解决方案
修改lucene源码在每次查询完成后将排序所使用的FieldCache里的缓存清空
- lucene2.4
- solr1.3
Lucene2.4中要修改的类或接口有
- org.apache.lucene.index.IndexReader
添加成员变量public String m_cacheKey = "cmhk_oom_bugfix";
- org.apache.lucene.search.Searcher
添加抽象方法
abstract public void release();在它的实现类中除org.apache.lucene.search.IndexSearcher外的都加上一个这个抽象方法的空实现
- org.apache.lucene.search.IndexSearcher
添加方法public void release() {
// 清除缓存数据
if (null !=
reader.m_cacheKey && !"".equals(reader.m_cacheKey))
{
if (null != FieldSortedHitQueue.Comparators)
{
FieldSortedHitQueue.Comparators.ReleaseCache(reader.m_cacheKey);
}
FieldCache.DEFAULT.ReleaseFieldCache(reader.m_cacheKey);
ExtendedFieldCache.EXT_DEFAULT.ReleaseExtendedFieldCache(reader.m_cacheKey);
// 立即回收垃圾
//
System.gc();
}
}
- org.apache.lucene.search.FieldCache
添加方法void ReleaseFieldCache(String
strCacheKey);
- org.apache.lucene.search.FieldCacheImpl
添加方法public void
ReleaseFieldCache(String strCacheKey)
{
bytesCache.ReleaseCache(strCacheKey);
shortsCache.ReleaseCache(strCacheKey);
intsCache.ReleaseCache(strCacheKey);
floatsCache.ReleaseCache(strCacheKey);
stringsCache.ReleaseCache(strCacheKey);
stringsIndexCache.ReleaseCache(strCacheKey);
autoCache.ReleaseCache(strCacheKey);
customCache.ReleaseCache(strCacheKey);
}
org.apache.lucene.search.FieldCacheImpl.Cache
添加方法// 用于清除缓存
public
void ReleaseCache(String strCacheKey)
{
if (null != readerCache) {
synchronized (readerCache) {
if (null !=
readerCache.get(strCacheKey)) {
((Map)
readerCache.get(strCacheKey)).clear();
}
}
}
}修改org.apache.lucene.search.FieldCacheImpl.Cache.get(IndexReader,
Object)方法public Object get(IndexReader reader, Object key)
throws IOException {
Map
innerCache;
Object value;
synchronized (readerCache) {
//改键值为静态值
innerCache = (Map)readerCache.get(reader.m_cacheKey);
// innerCache = (Map)
readerCache.get(reader);
if
(innerCache == null) {
innerCache = new
HashMap();
//改键值为静态值
readerCache.put(reader.m_cacheKey,innerCache);
//readerCache.put(reader, innerCache);
value
= null;
} else {
value = innerCache.get(key);
}
if (value == null)
{
value = new
CreationPlaceholder();
innerCache.put(key,
value);
}
}
if
(value instanceof CreationPlaceholder)
{
synchronized (value)
{
CreationPlaceholder progress =
(CreationPlaceholder) value;
if
(progress.value == null)
{
progress.value = createValue(reader,
key);
synchronized
(readerCache) {
innerCache.put(key,
progress.value);
}
}
return
progress.value;
}
}
return
value;
}
}
- org.apache.lucene.search.ExtendedFieldCache
添加方法//用于清除缓存
void
ReleaseExtendedFieldCache(String
strCacheKey);
- org.apache.lucene.search.ExtendedFieldCacheImpl
添加方法// 用于清除缓存
public
void ReleaseExtendedFieldCache(String
strCacheKey)
{
longsCache.ReleaseCache(strCacheKey);
doublesCache.ReleaseCache(strCacheKey);
autoCache.ReleaseCache(strCacheKey);
}
solr1.3中要修改的类或接口
- org.apache.solr.search.SolrIndexSearcher
添加方法public void
release(){
searcher.release();
}
- org.apache.solr.core.SolrCore
修改私有方法private RefCounted<SolrIndexSearcher>
newHolder(SolrIndexSearcher newSearcher) {
RefCounted<SolrIndexSearcher> holder
= new
RefCounted<SolrIndexSearcher>(newSearcher) {
public void
close() {
try {
synchronized(searcherLock) {
// it's possible for someone to get a reference via the _searchers
queue
// and increment the refcount
while RefCounted.close() is being called.
// we check the refcount again to see if this has happened and
abort the close.
// This relies on the
RefCounted class allowing close() to be called every
// time the counter hits
zero.
resource.release();//释放FieldCache中的内存
if (refcount.get() >
0) return;
_searchers.remove(this);
}
resource.close();
}
catch (IOException e)
{
log.severe("Error closing searcher:"
+
SolrException.toStr(e));
}
}
};
holder.incref();
// set ref count to 1 to account for
this._searcher
return
holder;
}
- org.apache.solr.util.RefCounted<Type>
修改方法org.apache.solr.util.RefCounted.decref()
public void
decref() {
// if (refcount.decrementAndGet() == 0)
{
close();
//
}
}
(转)solr排序OOM解决方法的更多相关文章
- php数组怎么根据其中的一个值进行排序?解决方法
有一个数组如下 我想对其进行一个排序,按照其“sort”的值的大小进行排序,3->4->7. 解决方法如下: 1.首先介绍php的两个方法 方法一:array_column() 返回输入数 ...
- oracle数据库对date字段类型存在空值进行排序的处理方法
oracle数据库对date字段类型存在空值进行排序的处理方法 oracle 数据库,如果表中有一个字段类型为date,且该字段类型存在空值,并且需要排序, 解决方法为使用oracl ...
- Spark java.lang.outofmemoryerror gc overhead limit exceeded 与 spark OOM:java heap space 解决方法
引用自:http://cache.baiducontent.com/c?m=9f65cb4a8c8507ed4fece7631046893b4c4380146d96864968d4e414c42246 ...
- 无法解决 equal to 运算中 "Chinese_PRC_CI_AS" 和 "Chinese_PRC_90_CI_AI" 之间的排序规则冲突。的解决方法
在SQL SERVICE的查询的时候遇到了“无法解决 equal to 运算中 "Chinese_PRC_CI_AS" 和 "Chinese_PRC_90_CI_AI&q ...
- Java中关于OOM的场景及解决方法
原文地址:http://developer.51cto.com/art/201112/305696.htm 1.OOM for Heap=>例如:java.lang.OutOfMemoryErr ...
- Java中关于OOM的场景及解决方法(转)
http://developer.51cto.com/art/201112/305696.htm 1.OOM for Heap=>例如:java.lang.OutOfMemoryError: J ...
- layui表格点击排序按钮后,表格绑定事件失效解决方法
最近项目使用layui较为频繁,遇到了一个麻烦的问题,网上搜索也没有看到同类型的问题,故此记下来. 需求是点击上图右侧表格中某一个单元格,会触发点击事件如下代码: $("table>t ...
- Spark面对OOM问题的解决方法及优化总结 (转载)
转载地址: http://blog.csdn.net/yhb315279058/article/details/51035631 Spark中的OOM问题不外乎以下两种情况 map执行中内存溢 ...
- [转载] java中关于OOM的场景及解决方法
1.OOM for Heap=>例如:java.lang.OutOfMemoryError: Java heapspace[分析] 此OOM是由于JVM中heap的最大值不满足需要,将设置hea ...
随机推荐
- NEV_SDK开发环境部署手册
根据项目开发需求,要在MEC服务器上部署如下内容:Nginx.Nginx push stream module.Jason CPP.Spawn-fcgi.libfcgi.Redis.Hiredis.B ...
- Device disconnected
问题:android 调试的时候,Logcat没有任何输出,提示Device disconnected 解决:Devices -- Reset adb
- GNU_makefile_template
#g++ compiler: options # -std=c++0x enables ISO C++ 11 standard # -I.. pulls in the Version_test.h f ...
- 一步步学习ASP.NET MVC3 章节总结
请注明转载地址:http://www.cnblogs.com/arhat 对于<一步步学习ASP.NET MVC3>系列工15章,那么为了方便大家能够快速的预览,老魏在这里为这个系列提供一 ...
- Mapped Statements collection does not contain value for TaskMapper.selectByPrimaryKey
Mapped Statements collection does not contain value for后面是什么类什么方法之类的: 错误原因有几种: 1.mapper.xml中没有加入name ...
- Impala入门笔记
From:http://tech.uc.cn/?p=817 问题背景: 初步了解Impala的应用 重点测试Impala的查询速度是否真的如传说中的比Hive快3~30倍 写作目的: 了解Impala ...
- WinForm 控件库
1:Telerik 介绍: Telerik 是保加利亚的一个软件公司,专注于微软.Net平台的表示层与内容管理控件.Telerik 提供高度稳定性和丰富性能的组件产品,并可应用在非常严格的环境中. 现 ...
- 第二好用的时间日期选择插件(jscal)
这个是第二好用的了,支持鼠标滚动选择时间.功能很强大,文档:http://www.dynarch.com/jscal/ 效果图: <!DOCTYPE html PUBLIC ...
- PAT-乙级-1027. 打印沙漏(20)
1027. 打印沙漏(20) 时间限制 200 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 CHEN, Yue 本题要求你写个程序把给定的符号打印成 ...
- Magento学习
Magento是一个php电子商务系统. 内部模块化. 创建模块流程 Magento系统模块 app/code/core/Mage 其中每一个子目录都是一个单独的模块 自己创建的模块放在下面路径 ap ...