开源搜索引擎Iveely 0.7.0发布,不一样,那就让他不一样!
2012年08月05日,Iveely Search Engine 0.1.0发布,今天,怀着对于未来的追求,终于,0.7.0如期和大家见面了,7个版本,历时2年4个月,感谢大家的支持,感谢我不离不弃的战友魏琪,奋斗到深夜,放弃了周末的社交,就为0.7.0如期而至;感谢Bogdan P Sliwowski先生,您的支持,让我们的激情和梦想靠得越来越近。下载安装编译部署,请参考Github,Web访问的时候,请确定您的浏览器支持WebSocket。
- 概 要
此次的版本,最大的技术改变是将纯C#迁移到了纯Java,由于是第一次迁移至Java且由于Java功底不好,所以,代码难免有不足之处,还请大家多多谅解。如果您有比较好的建议可以在这里提供给我们。整个项目由Iveely.Framework和Iveely.Computing以及Iveely.Search组成,Iveely.Search是基于Iveely.Computing的应用。Iveely.Framwork是一切程序的基础。本次版本包含了四大功能:文本检索、图像检索、百科检索、问答检索,其中问答检索是核心。下面看一下整体效果截图:
1. 1 文本检索功能

1.2 图片搜索

1.3 百科搜索

1.4 问答搜索
问答搜索一直是我们的核心业务,我们绝大部分时间和精力都集中在这里,不过还好,目前看,部分数据的效果还是不错的。


当然还有移动客户端的搜索结果:

以上均是无监督自我学习数据产生,但是由于服务器和数据量有限,某些结果不是很满意,当然我们也会积极改进。
1.2 技术窥视
在这里介绍详细的技术细节,可能不太现实。Iveely.Computing是整个程序运行的基础,也是让Iveely.Search变成分布式结构的运行平台,这点和0.6.0中C#版本有一定的改变,0.6.0种Iveely.Computing是一个分布式计算平台,可以进行多台机器计算一个任务,例如100亿个数相加。但是在0.7.0中,我们移除了这部分,因为我们也许不是去重新实现一个storm,以我们的实力和精力,是不够的,何况偏离了我们核心的业务,我们需要专注于我们需要实现什么,所以我们让Iveely.Computing更佳符合Iveely.Search的规范,多台机器协同工作,可以控制运行数据,拥有分布式缓存,目前则足以。
也许您很关心,Iveely能否能够像其它开源搜索引擎一样正常长期运行,这点,我们经过了严格测试,7*24小时无监督搜集数据和上线新数据,并提供服务。由于服务器的关系,我们在开源社区的示例,只提供了少量数据,我们的服务器上也只提供了少量数据。
对于专业的搜索引擎开发者,也许您更关心,如何搜集用户的行为数据,为广告投放和个性化搜索提供帮助?您可以很轻易的修改代码实现,其中我们已经做了部分在您点击搜索结果页面的时候,数据已经被采集,包括搜索词和此搜索词下用户点击的链接,可以帮助我们更好的进行网页排序。当然您也可以很容易的添加用户感兴趣的搜索,例如用户搜索完”手表“之后又搜索了”欧米茄“,且这样的用户很多,那么下回在搜索”手表“的时候,您可以把”欧米茄“的广告投放上去,效果应该不错,当然广告投放是很专业的,我当年研究生毕业的时候,论文就是广告投放和推荐,如果有机会,他对于未来的iveely非常重要,不管是移动端和web端。
博客园是个好地方,要是您对内部深入的技术感兴趣,可以在我们的开源主页中的issue中提问,我们会收到您的邮件,会尽量回复您。
1.3 Iveely Search Engine 0.8.0的未来
这两年中历时了7个版本,如果0.7.0是终结版,那么是一件多么可笑的事情,尽管我们遇到了很多困难,很多问题,几乎不可解决,但是在坚持下依然得到了期待的结果,假设现在放弃,怎能对得起未来,所以,0.8.0依然在路上等着我们,而且会越来越好,从0.1.0到0.7.0我们已经看到了这个趋势。0.8.0的任务主要集中在:问答的智能分析推理和图片分析上。为什么是这两项?对不起,我们选择了自己的路,并坚信它是对的,正如题目所说”不一样,那就让他不一样!“。
1.4 关于梦想
一般的时候,我不愿意写这种很”酸“的东西,所以我把这块写在最后,尽可能不要影响本文的核心点,梦想是一个说不清,道不明,但是却让你前行的东西,他的力量超越了欲望,世界在不断的变化,人也在不断的变化,但是总有一件事情没有变化,那就是我们的坚持,坚持是充满痛楚的,所以我们也总在寻找快乐,但最快乐的,莫过于为理想而奋斗!
1.5 捐助我们
我原本是不想写这小节,因为博客园是一个纯净的地方,但是希望大家能够原谅我,如果您愿意,我们非常希望您能够帮助我们,也许在您的帮助下,Iveely 0.8.0 将会是Iveely第一个向外提供服务的版本(我的邮箱:liufanping@iveely.com)。
您的朋友,凡平.
开源搜索引擎Iveely 0.7.0发布,不一样,那就让他不一样!的更多相关文章
- 开源搜索引擎Iveely 0.8.0发布,终见天日
这是一篇博客,不是,这是一篇开源人的心酸和喜悦,没有人可以理解我们的心情,一路的辛酸一路的艰辛,不过还好,在大家的支持下,总算是终见天日,谢谢那些给予我们无私帮助的朋友.您的支持,依然是我们无限的动力 ...
- 开源搜索引擎Iveely 0.8.0
开源搜索引擎Iveely 0.8.0 这是一篇博客,不是,这是一篇开源人的心酸和喜悦,没有人可以理解我们的心情,一路的辛酸一路的艰辛,不过还好,在大家的支持下,总算是终见天日,谢谢那些给予我们无私帮助 ...
- 开源搜索 Iveely Search Engine 0.6.0 发布 -- 黎明前的娇嫩
快两年了,Iveely Search Engine已经走过了5个版本的岁月,虽出生“贫寒”,没有任何开源基金会的支持,没有优秀的“干爹.干妈”,它凭着它的爱好者的支持,0.6.0终于破壳而出,7年前, ...
- 开源分布式计算引擎 & 开源搜索引擎 Iveely 0.5.0 为大数据而生
Iveely Computing 产生背景 08年的时候,我开始接触搜索引擎,当时遇到的第一个难题就是大数据实时并发处理,当时实验室的机器我们可以随便用,至少二三十台机器,可以,却没有程序可以将这些机 ...
- Iveely Search Engine 0.4.0 的发布
千呼万唤始出来,Iveely Search Engine 0.4.0 的发布 经过无数个夜晚的奋战,以及无数个夜晚的失眠,Iveely Search Engine 0.4.0 终于熬出来了,这其中 ...
- Java 开源博客——B3log Solo 0.6.1 正式版发布了!
Java 开源博客 —— B3LOG Solo 0.6.1 正式版发布了!欢迎大家下载. 该版本主要是改善细节体验,并加入了一款 Metro 风格的皮肤. 特性 基于标签的文章分类 Ping Goog ...
- GNU libmicrohttpd 0.9.29 发布 - 开源中国社区
GNU libmicrohttpd 0.9.29 发布 - 开源中国社区 GNU libmicrohttpd 0.9.29 发布
- virtenv 0.8.6 发布,虚拟桌面配置工具 - 开源中国社区
virtenv 0.8.6 发布,虚拟桌面配置工具 - 开源中国社区 virtenv 0.8.6 发布,virtenv 是一个用 QT4 开发的应用,用来配置和启动基于 LXC 的虚拟桌面环境.该容器 ...
- Java 开源博客——B3log Solo 0.6.7 正式版发布了!
Java 开源博客 -- B3log Solo 0.6.7 正式版发布了!欢迎大家下载. 另外,欢迎观摩 B3log 团队的新项目:Wide,也非常欢迎大家参与进来 :-) 特性 基于标签的文章分类 ...
随机推荐
- Oracle与SQL SERVER编程差异分析(入门)
网上有关Oracle与SQL SERVER性能差异的文章很多,结论往往是让你根据数据量与预算来选择数据库.但实际项目中,特别是使用 .Net 开发的系统,支持以上两种数据库或者更多已经成为Boss的普 ...
- Spring-framework下载
下载版本,修改版本号就行. http://repo.springsource.org/libs-release-local/org/springframework/spring/4.3.2.RELEA ...
- HTTP Session原理
深入理解HTTP Session session在web开发中是一个非常重要的概念,这个概念很抽象,很难定义,也是最让人迷惑的一个名词,也是最多被滥用的名字之一,在不同的场合,session一次的 ...
- zabbix安装排错过程
在讲安装过程之前需要先把zabbix的工作流程简单的讲一遍:zabbix是个开源监控软件,通过web才能更直观的监控我们想要监控的主机,同时,zabbix从被监控主机获取到的信息需要存放在数据库中,因 ...
- NOIP2011提高组 聪明的质监员 -SilverN
题目描述 小T 是一名质量监督员,最近负责检验一批矿产的质量.这批矿产共有 n 个矿石,从 1到n 逐一编号,每个矿石都有自己的重量 wi 以及价值vi .检验矿产的流程是: 1 .给定m 个区间[L ...
- cni 添加网络 流程分析
cnitool: Add or remove network interfaces from a network namespace cnitool add <net> <netns ...
- bzoj-3170 3170: [Tjoi 2013]松鼠聚会(计算几何)
题目链接: 3170: [Tjoi 2013]松鼠聚会 Time Limit: 10 Sec Memory Limit: 128 MB Description 有N个小松鼠,它们的家用一个点x,y表 ...
- FZU 2148 Moon Game --判凹包
题意:给一些点,问这些点能够构成多少个凸四边形 做法: 1.直接判凸包 2.逆向思维,判凹包,不是凹包就是凸包了 怎样的四边形才是凹四边形呢?凹四边形总有一点在三个顶点的内部,假如顶点为A,B,C,D ...
- HDU 1698 & UESTC 1228 Just a hook
算是线段树中的一道水题了,必须用到懒操作,否则会超时.或者也可以刚开始不计算和,只更新节点,最后算整个线段的颜色和. 1.懒操作法 /* 908ms 3448KB in HDU OJ*/ #inclu ...
- 02SpringMvc_springmvc快速入门小案例(XML版本)
这篇文章中,我们要写一个入门案例,去整体了解整个SpringMVC. 先给出整个项目的结构图: