Xunsearch 是开源免费.高性能.多功能,简单易用的专业全文检索技术方案,是目前非常知名的开源搜索引擎. 安装完Xunserach,还需要安装PHP SDK,才能进行搜索. ----- 本人已在腾讯云实验室建立了实验,可以直接上机操作.当然,你也可以用自己的服务器进行测试. 实验室地址    https://cloud.tencent.com/developer/labs/lab/10424 ----- 软件环境: Centos 7 目录 1.安装 GCC 依赖 2.安装xunsearch…
使用 Redis 进行搜索 P153 通过改变程序搜索数据的方式,并使用 Redis 来减少绝大部分基于单词或者关键字进行的内容搜索操作的执行时间. P154 基本搜索原理 P154 倒排索引 (inverted indexes) 是互联网上绝大部分搜索引擎使用的底层结构,它类似于书本末尾的索引.倒排索引从每个被索引的文档里面提取一些单词,并记录包含每个单词的文档集合. P154 示例 假设有三个文档: R = "it is what it is" S = "what is…
Solr Multicore 是 solr 1.3 的新特性.其目是一个solr实例,可以有多个搜索应用. 下面着手来将solr给出的一个example跑出来.这篇文章是基于<利用SOLR搭建企业搜索平台 之——运行solr>,有不明白的请参见http://lianj-lee.javaeye.com/blog/424383 1. 找到solr下载包中的example文件夹,在它的下面有个multicore文件夹,将这个文件夹下面的所有东西copy到 c:/solr-tomcat/solr下面.…
利用Lucene.net搜索引擎进行多条件搜索的做法 2018年01月09日 ⁄ 搜索技术 ⁄ 共 613字 ⁄ 字号 小 中 大 ⁄ 评论关闭 利用Lucene.net搜索引擎进行多条件搜索的做法 1 联合两个索引查询,已解决: IndexSearcher[] searchers = new IndexSearcher[2];    searchers[0] = new IndexSearcher(m_indexpath); searchers[1] = new IndexSearcher(m…
前言:       上周末自己学习了一下Kafka,参考网上的文章,学习过程中还是比较顺利的,遇到的一些问题最终也都解决了,现在将学习的过程记录与此,供以后自己查阅,如果能帮助到其他人,自然是更好的. ===============================================================长长的分割线==================================================================== 正文: 关于Kafka…
前言:       前段时间自己参考网上的文章,梳理了一下基于分布式环境部署的业务系统在解决数据一致性问题上的方案,其中有一个方案是使用ZooKeeper,加之在大数据处理中,ZooKeeper确实起到协调服务的作用,所以利用周末休息时间,自己在虚拟机上简单搭建了一个ZooKeeper集群,学习了解一下. ===============================================================长长的分割线===========================…
前言:       前段时间自己学习如何部署伪分布式模式的hadoop环境,之前由于工作比较忙,学习的进度停滞了一段时间,所以今天抽出时间把最近学习的成果和大家分享一下.       本文要介绍的是如何利用VMware搭建自己的hadoop的集群.如果大家想了解伪分布式的大家以及eclipse中的hadoop编程,可以参考我之前的三篇文章. 1.在Linux环境中伪分布式部署hadoop(SSH免登陆),运行WordCount实例成功. http://www.cnblogs.com/Purple…
最近Power BI有了最新更新,想着利用 Power BI 工具制造一个动态的搜索界面,比如动态切换搜索引擎,分别从百度.360.搜狗等搜索苹果最新新闻.通过一番测试,最终实现了相关功能. 数据加载 首先我们加载三张表:搜索引擎.搜索类型.关键字. 创建度量值 增加度量值:字符串前缀 增加度量值:搜索类型字符串 增加度量值:网页链接 图表制作 放置三个切片器:搜索引擎.搜索类型.关键字. 添加一个加载Html的视觉对象,htmlViewer.因为htmlViewer视觉对象,只能使用数据“列”…
通过 <利用Hexo搭建个人博客-环境搭建篇> 以及 <利用Hexo搭建个人博客-博客初始化篇>,我们了解到了利用Hexo搭建个人博客需要的环境以及配置,下面这篇文章将会介绍如何把我们的博文发布到github上. 1 GitHub 配置 在<利用Hexo搭建个人博客-环境搭建篇> 一文中,我们对Github有了一个基本的了解,并且已经在本地搭建好了git的基本环境.如果想要发布博文到github上,我们还需要到github上去进行用户的注册. 1.1 注册GitHub…
上一篇博文 <利用Hexo搭建个人博客-环境搭建篇> 中,我们讲解了利用Hexo搭建个人博客应该要配置哪些环境.相信大家已经迫不及待的想要知道接下来应该要怎么把自己的博客搭起来了,下面,让我们一起见证这奇迹的时刻. 1 初始化博客 首先,我们需要按照下面的步骤进行博客的初始化: 1> 创建一个hexo-blog文件夹,当然你也可以命名为其他名字,这里以hexo-blog为例 $ mkdir hexo-blog 2> 执行以下命令,Hexo将会在目标文件夹下建立博客需要的所有文件 $…