solr es调优化和问题排查

（1）TOP 显示当前进程状态，结合 ps -aux 可以看是哪一个服务。mpstat 可以看是cpu的负载

（2）TOP -H -u 用户名显示该用户下所有的线程。还有pstree

（3）jstat -gc pid 1000 100 查看当前程序的GC问题

（4）jstack pid 看有哪些进程是 RUNNING WAITING

（5）jmap -histo:live 24715 | less 查看java中内存的分配情况 jmap -heap pid 当前堆内存中分配情况

（6）cat /proc/net/sockstat 看当前的socket是否有异常

降低solr CPU和内存的使用：

autowarmCount设为0，filterCache的大小都调到3000 减少内存的使用和CPU的使用

通过进行日志挖掘，限制最大最大可以查询的数据量，避免深分页

降低错误率，不要返回exception 返回 “”

ES优化

（1）多个分片放在一台服务器下（这多个分片组成的数据是完整的），有个属性可以优先设置优先读取当前服务器中的其他节点。
（2）缓存 set get 改为异步方法，而非同步方法

（3）将构建索引构建选择在请求量不大的时间段（假的读写分离），因为构建索引的时候会消耗cpu，会影响Query使用cpu.

（4）close 不需要的index，释放非必需index所占用的内存和CPU。

（5）search preference 可设置为local 避免跨机房网络传输。

（6）上新时间点会频繁更新doc，导致cpu利用率过高，采用timeline的方式，以时间轴的方式去判定状态。

方向：

是否可以做读写分离，分片的意义是不是不大

搜索服务中的问题：

（1）用线程的问题，如果请求量过多的话，线程有可能阻塞。

（2）打分公式中累计取redis的时间会比较长，造成整体时间长，统计数据量，加入超时限制callable future get

（3）该filter的进行filter 关键字的匹配从filter中去除，只filter一些通用条件，减少query中的重复计算

（4）打分脚本script采用store的方式

（5）增加service层的缓存区间，比如用户请求20条数据，设置发送到es端为100条并进行缓存，以此减少对es频繁的访问

（6）挖掘搜索日志，限制size 避免深分页。

（7）采用游标curosr和scroll

（8）full gc 导致队列中的请求过多，造成swap memeory https://www.cubrid.org/blog/maxclients-in-apache-and-its-effect-on-tomcat-during-full-gc

搜索的准确率和召回率：

（1）slop 过大则准确率降低，但是召回率升高

solr es调优化和问题排查的更多相关文章

ES 调优查询亿级数据毫秒级返回！怎么做到的？--文件系统缓存
一道面试题的引入: 如果面试的时候碰到这样一个面试题:ElasticSearch(以下简称ES) 在数据量很大的情况下(数十亿级别)如何提高查询效率? 这个问题说白了,就是看你有没有实际用过 ES,因 ...
实时查询系统架构：spark流式处理+HBase+solr/ES查询
最近要做一个实时查询系统,初步协商后系统的框架 1.流式计算:数据都给spark 计算后放回HBase 2.查询:查询采用HBase+Solr/ES
lucent,solr,ES比较
|0什么是全文搜索什么是全文搜索引擎? 百度百科中的定义:全文搜索引擎是目前广泛应用的主流搜索引擎.它的工作原理是计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现 ...
solr性能调优
Schema Design Considerations indexed fields indexed fields 的数量将会影响以下的一些性能: 索引时的时候的内存使用量索引段的合并时间优化时 ...
SOLR缓存调优
缓存在 Solr 中充当了一个非常重要的角色,Solr 中主要有这三种缓存: Filter cache(过滤器缓存),用于保存过滤器(fq 参数)和层面搜索的结果 Document cache(文档缓 ...
[redis]复制机制，调优，故障排查
在redis的安装目录下首先启动一个redis服务,使用默认的配置文件,作为主服务 ubuntu@slave1:~/redis2$ ./redis-server ./redis.conf & ...
ES的优化布局
分词优化:IK Analyser Elastic Search 5.x官方提供的中文搜索并不友好,分词时经常将一句话分成很多单字,这时候可以使用IK Analyser插件进行优化,当然你在写java代 ...
Es性能优化
1. Es中10亿级别的数据量,如何提高查询效率 (1) 性能优化关键:file system cache a. 不要期待随手挑一个参数,就可以万能的应对所有性能慢的场景 b. es依赖于底层的fil ...
ES调优
ES Connection timed out,调优方向 1. 使用游标滚动查询 scrollId 游标id searchResponse.getScrollId() scroll 设置游标的保留时间 ...

随机推荐

symfonos2
0x01 进入网页啥也没有 0x02 目录爆破啥也没有 0x03 端口扫描知识盲区: ProFTPD 1.3.5 用ProFTPD服务权限执行复制命令,默认在'nobody'用户的特权下运行.通 ...
Dynamics 365 marketing中添加自定义渠道磁贴
Dynamics 365 marketing中默认的渠道只有Marketing Email和Marketing Activity,想要添加其他渠道必须自定义磁贴,自定义磁贴的步骤如下: 1.创建实体 ...
sed命令简介
sed处理时,有2个缓冲区:[pattern space]和[hold space] sed执行过程: 先读入一行,去掉尾部换行符,存入[pattern space],执行编辑命令. 处理完毕,除非加 ...
python第三方库的安装pip的使用与换源(解决pip下载速度慢)
python和其他语言一样,也有大量的第三方库在安装python时默认都会安装pip,安装了pip后在cmd.exe下可以运行pip 安装库 pip install 库的名字换源因为PyPi地 ...
LINUX下EFIBOOTMGR的使用,删除UEFI主板多余启动项和添加启动项
用uefi装了几次次archlinux,搞的uefi启动选项下多出来好多启动项..这东西重格硬盘也是不好用的.发现以下方法可以解决. efibootmgr //显示efi的启动项删除一个引导项 ...
ConcurrentHashMap的size()方法（1.7和1.8）
在1.7和1.8版本中,计算size()方法有写不同.先介绍1.7版本的实现. 1.7版本在1.7版本中,有一个重要的类Segment,利用它来实现分段锁 static final class Se ...
纪中10日T3 2296. 神殿 bfs
2296. 神殿 (File IO): input:temple.in output:temple.out 时间限制: 1500 ms 空间限制: 524288 KB 具体限制 Goto Prob ...
Enable VT-x in your BIOS security settings, ensure that HAXM is installed properly. Try disabling 3rd party security software if the problem still occurs
win7系统安装了了AndroidStudio3.5后用模拟器报错:Enable VT-x in your BIOS security settings, ensure that HAXM is in ...
关于Git GUI克隆代码
1.首先需要使用Git GUI生成一个SSH秘钥并将其拷贝到远程(码云或者GitHub)账号下的SSH公钥中(以码云为例) 将上一步生成的SSH密钥拷贝到下面的码云的公钥中 2.拷贝下码云上代码的SS ...
.net core3.0 webapi搭建(一)
一.创建WebApi项目: 生成项目之后,控制器默认生成了一个WeatherForecastController 我们可以直接启动项目,F5调试,默认进入WeatherForecastControll ...

solr es调优化和问题排查

solr es调优化和问题排查的更多相关文章

随机推荐

热门专题