Sharepoint搜索引擎主要由6种组件构成,他们分别是爬网组件,内容处理组件,分析处理组件,索引组件,查询处理组件,搜索管理组件。可以将这6种组件分别部署到Sharepoint场内的多个服务器上,组成适合需求的Sharepoint搜索场,搜索场的体系结构设计主要参考量是爬网内容量,微软根据爬网内容量不同将搜索场分为大型场,中型场和小型场,更多详细信息可参考: SharePoint Server 2013 中的搜索概述在SharePoint Server 2013 中规划企业搜索体系结构

Sharepoint搜索引擎构架图

内容量

搜索体系结构

0 - 1000 万个项

小型搜索服务器场

1000 万 - 4000 万个项

中型搜索服务器场

4000 万 - 1 亿个项

大型搜索服务器场

下图为一个小型搜索拓扑的例子,据微软测试可以支持1000万个项目,并测量出它每秒可以爬网 50 个文档,且每秒服务 10 个查询。对于每秒 50 个文档的爬网率,首次完全爬网中,需要搜索 55 个小时来爬网 1000 万个项目。

小型场服务器拓扑

以下为这个小型场的硬件需求说明:

机服务器

应用程序或数据库服务器

存储量

RAM

处理器

A、B

带有查询处理和索引组件的应用程序服务器

500 GB

16 GB

1.8 GHz 4x CPU 内核

A、B

带有爬网、搜索管理、分析和内容处理组件的应用程序服务器。

200 GB

8 GB

1.8 GHz 4x CPU 内核

A、B

带有所有搜索数据库的数据库服务器。

100 GB

16 GB

1.8 GHz 4x CPU 内核

搜索组件说明:

搜索组件名称

说明

爬网组件

对内容源进行爬网可从已爬网项目中收集已爬网属性和元数据,并将此信息发送到内容处理组件

内容处理组件

转换已爬网项目并将其发送到索引组件。此组件还会将已爬网属性映射到托管属性

分析处理组件

执行搜索分析和使用情况分析

索引组件

从内容处理组件中搜索已处理的项目并将其写入搜索索引。此组件还可以处理传入查询、从搜索索引中检索信息并将结果集发送回查询处理组件

查询处理组件

分析传入查询。这有助于提高精确度、改进检索和提高相关性。查询将发送到索引组件,该组件将为查询返回一组搜索结果

搜索管理组件

运行搜索的系统进程,添加并初始化搜索组件的新实例

搜索数据库说明:

搜索数据库名称

说明

爬网数据库

存储跟踪信息和有关已爬网项目(如文档和 URL)的历史信息。还将存储上一次爬网时间、上一次爬网 ID 和上一次爬网期间的更新类型(添加、更新、删除)等信息。

链接数据库

存储由内容处理组件提取的未处理信息和有关搜索单击的信息。分析处理组件将分析此信息。

分析报告数据库

存储使用情况分析的结果。

搜索管理数据库

存储搜索配置数据

博客转自:《Sharepoint2013搜索学习笔记之搜索构架简单概述(一)

[转载]SharePoint 2013搜索学习笔记之搜索构架简单概述的更多相关文章

  1. Sharepoint2013搜索学习笔记之搜索构架简单概述(一)

    Sharepoint搜索引擎主要由6种组件构成,他们分别是爬网组件,内容处理组件,分析处理组件,索引组件,查询处理组件,搜索管理组件.可以将这6种组件分别部署到Sharepoint场内的多个服务器上, ...

  2. [转载]SharePoint 2013搜索学习笔记之自定义结果源

    搜索中心新建好之后在搜索结果页上会默认有所有内容,人员,对话,视频这四个结果分类,每个分类会返回指定范围的搜索结果,这里我再添加了部门日志结果分类,搜索这个分类只会返回部门日志内容类型的搜索结果,要实 ...

  3. [转载]SharePoint 2013搜索爬外网配置

    本文介绍SharePoint 2013 设置外网(Internet)爬网源: 下面是步聚: 1. 新建外部爬网源 a. 打开 “SharePoint 2013 Central Administrati ...

  4. VSTO学习笔记(一)VSTO概述

    原文:VSTO学习笔记(一)VSTO概述 接触VSTO纯属偶然,前段时间因为忙于一个项目,在客户端Excel中制作一个插件,从远程服务器端(SharePoint Excel Services)上下载E ...

  5. APPCAN学习笔记004---AppCan与Hybrid,appcan概述

    APPCAN学习笔记004---AppCan与Hybrid,appcan概述 技术qq交流群:JavaDream:251572072 本节讲了appcan的开发流程,和开发工具 笔记不做具体介绍了,以 ...

  6. OGG学习笔记03-单向复制简单故障处理

    OGG学习笔记03-单向复制简单故障处理 环境:参考:OGG学习笔记02-单向复制配置实例 实验目的:了解OGG简单故障的基本处理思路. 1. 故障现象 故障现象:启动OGG源端的extract进程, ...

  7. QML学习笔记(六)- 简单计时器和定时器

    做一个简单的qml计时器和定时器,左键触发计时,右键触发定时 GitHub:八至 作者:狐狸家的鱼 本文链接:QML学习笔记(六)- 简单计时器和定时器 左键点击按钮,触发计时器,中键可以暂停计时,同 ...

  8. HTTP学习笔记02-HTTP报文格式之概述

    HTTP学习笔记02-HTTP报文格式之概述 HTTP学习笔记02-HTTP报文格式之概述 HTTP报文格式 报文的语法 起始行 首部 实体部分 学习一个协议感觉最有意思的就是看包结构…在我看来这是唯 ...

  9. Sharepoint2013搜索学习笔记之设置业务数据内容源(六)

    Sharepoint搜索爬网组件支持爬Business Data Connectivity Service 承载的外部数据,关于Business Data Connectivity Service设置 ...

随机推荐

  1. python None与Null

    一.Python对象 要理解这个,首先要理解Python对象: python对象具有三个特性:身份.类型.值. 三特性在对象创建时被赋值.只有值可以改变,其他只读. 类型本身也是对象. 二.Null与 ...

  2. solr课程学习系列-solr服务器配置(2)

    本文是solr课程学习系列的第2个课程,对solr基础知识不是很了解的请查看solr课程学习系列-solr的概念与结构(1) 本文以windows的solr6服务器搭建为例. 一.solr的工作环境: ...

  3. iOS相册、相机、通讯录权限获取

    iOS相册.相机.通讯录权限获取 说明 这是本人写的一个工具,用以便利的处理各种权限获取的操作,目前提供相册.照相机.通讯录的权限获取操作,参考了 http://www.jianshu.com/p/a ...

  4. MySQL实现定时任务

    如果要每30秒执行以下语句 '; 可以给MySQL建个定时任务,具体如下: delimiter // /* 设定语句终结符为 //,因存储过程语句用;结束 */ 一.查看event是否开启 show ...

  5. [界面开发新秀]AYUI开发360领航版系列教程-AyWindow接入[1/40]

    开发包DLL下载地址:请加入 466717219群,自己下载(已经发布ayui3.7,在群里,为了不让你作为收藏工具,也只有入群才能下载,喜欢你就进.不喜欢你还是不要来了) AYUI初衷:简单化商业软 ...

  6. 源代码目录结构--AngularJS学习笔记(一)

    最近开始接触AngularJS,确实是一个相当不错的东西,可以把很多东西简化掉.又对于其中的双向绑定等的实现很好奇,加之正在学习Javascript的东西,所以觉得从源代码这块开始深入学习Angula ...

  7. Windows下安装 msysGit 以及初始化 Git server环境

    Windows下git工具msysGit使用以及Git server初始化 Windows下git工具,这里选择msysGit,版本为msysGit-netinstall-1.8.1.2-previe ...

  8. jQuery 通配符

    通配符: $("input[id^='code']");//id属性以code开始的所有input标签 $("input[id$='code']");//id属 ...

  9. LeetCode: Convert Sorted List to Binary Search Tree 解题报告

    Convert Sorted List to Binary Search Tree Given a singly linked list where elements are sorted in as ...

  10. C#标准响应数据

    public HttpResponseMessage UpdateModule(Mode mode) { var response = Process.Instance.ExecuteString(( ...