有一个项目,没有对表单进行严格的权限管理,虽然用户在自己的首页只能看到属于的单子,但是在搜索的时候,所有人的单子都能被搜到,所以客户造成了困惑. 那么问题来了,怎么让列表或者文档库不被爬网爬到. 有两种解决方法: 第一种:在管理中心的search service application 中,在爬网log管理界面下,有一个设置,输入一个url,保存,然后就可以排除掉该url下的所有内容. 第二种方法:进入列表--->列表设置--->高级设置----->有一个关于search的设置项,选择不…
本文是参考MSDN文档做的示例,SharePoint 2013搜索二进制对象(BLOB),通过外部内容类型的方式将外部数据与SharePoint相关联,修改BCD模型,使SharePoint能够爬网外部数据中的文件流. 步骤,首先就是使用SPD创建外部内容类型,并为外部内容类型添加各种操作:然后,将BCD模型导出,添加方法后重新导入:最后,配置爬网,对外部内容类型进行爬网. 1.首先,用Designer 2013打开站点,点击左上角按钮,创建外部内容类型: 2.输入外部内容类型的名称,点击“单击…
了解在 SharePoint Server 2013 中爬网的最佳做法 搜索系统对内容进行爬网,以构建一个用户可以对其运行搜索查询的搜索索引.本文包含有关如何最有效地管理爬网的建议. 本文内容: 使用默认内容访问帐户对大部分内容进行爬网 有效使用内容源 对用户配置文件进行爬网,然后再对 SharePoint 网站进行爬网 使用连续爬网确保搜索结果为最新 使用爬网规则排除已爬网的不相关的内容 对 SharePoint Web 应用程序的默认区域进行爬网 降低对 SharePoint 爬网目标进行爬…
在创建外部内容类型后创建外部列表是一项非常简单的任务,有如下4种方式进行: 可使用 Microsoft SharePoint Designer 2010 浏览器来完成 VS2010的列表实例 采用代码创建   1.可使用 Microsoft SharePoint Designer 2010 启动 Microsoft SharePoint Designer,然后打开包含外部内容类型的 SDK 示例 SharePoint 网站. 单击左导航栏上的"外部内容类型".这将显示在该网站的服务应用…
摘要:了解默认情况下 SharePoint 2013 爬网的文件扩展名及其解析的文件类型,可以借此了解搜索可以爬的文件和支持的功能. 如果“管理文件类型”页上的列表包含文件扩展名,爬网组件将仅爬网文件.内容处理组件只能解析爬网文件的内容: 当它具有可解析文件格式的格式处理程序. 当使用格式处理程序解析具有文件格式和文件扩展名的文件时. 默认情况下,SharePoint 2013 满足很多文件类型的这些要求. 默认爬网文件扩展名和解析文件格式 下表显示 SharePoint 2013 具有内置格式…
能否对所有类型的内容源都使用连续爬网?不能.连续爬网仅适用于 SharePoint 型内容源.所有其他类型的内容源将继续选择增量爬网和完全爬网. 使用连续爬网是否会给存储库增加额外负载?连续爬网的资源占用与增量爬网相似.当发出请求的频率增加后,对一个存储库/主机的并发请求最大数仍将由 *爬网影响规则* 控制.该规则定义了可发出请求的并发线程的最大数,最大数默认设置为 12 个线程,但可以根据业务要求和/或容量计划进行更改. 使用连续爬网时是否需要设置增量爬网或完全爬网?使用连续爬网时不需要配置增…
最近在政府部门介绍SharePoint 2013 新功能,我也准备了很多,比如SharePoint 2013的Search.以后有机会谈谈Office Web App,Workflow等. SharePoint 2013的搜索功能很强大,特别是在社交领域的搜索让我耳目一新(如发掘知识,发现人际关系等).如下所示是一个SharePoint 普通搜索,可以看到实现对Office的全文检索(当然还包含很多,比如PDF). 启用Search Service Application SharePoint…
SharePoint 2010  修改默认列表样式 :可以通过修改 下面两个全局配置进行修改.(未完..更新中...)  C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\template\global\xml\VWSTYLES.XMLC:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\14\template\LAYO…
前面用的方法是通过界面上操作,根据自定义模版,创建的列表.sharepoint 2010 使用自定义列表模版创建列表(1) 这里顺便记录多另一种方法,通过程序来创建. ---------------------------------------------------------------------------------------------------------------------------------- private void CreateListByCustomTemp…
本文讲述 SharePoint 2013 讨论板列表"Connect to Outlook" 不可用解决方案. SharePoint中的讨论板列表是可以集成到Outlook里面去的,用户可以在Outlook浏览讨论板的内容,发起新的讨论,回复讨论,就像操作邮件一样. 但是导航到discuss list 列表,"Connect to Outlook" 是不可用的 这是因为开启了 "Minimal Download Strategy" feature…
sharepoint 2010 在自定义列表的字段上增加功能菜单方法 打开sharepoint designer 2010,找到需要修改的视图页面,例如allitem.aspx,编辑这个页面,点击高级设置,修改下面的 <ViewFields> </ViewFields> 字段属性 <ViewFields><FieldRef Name="LinkTitle"/> <FieldRef Name="FSex" Link…
介绍:SharePoint的搜索着实强大,而且最近用到SharePoint搜索第三方爬网,感觉收获挺大,而且网上资料没找到太多类似的,就小记录一下,分享给大家. 首先,我自己写了一个net页面,里面读取所有我需要内容,充当SharePoint爬网的数据源,对这个页面进行爬网,页面如下图: 然后,打开SharePoint管理中心,搜索设置,新建内容源Crawl,爬网http://moss:9000,如下图.爬网设置可以按照自己的需要进行设置,比如想要爬网页面深度,可以进行设置,我的爬网,只是爬网页…
今天发现SP爬网出现了问题,持续时间蛮长的,一直爬不到内容. 解决方案: 这里有一条解决在SharePoint 2010搜索爬网时遇到的"拒绝访问错误"的小技巧. 首先要检查默认内容访问帐户是否具有相应的访问权限,或者添加一条相应的爬网规则.如果目标资源库是一个SharePoint库,验证一下该帐号是否具有对该SharePoint web应用程序具有至少"完全读取"的权限. 当我在升级上来的SharePoint环境中对我新建的博客URL进行爬网时遇到了这个错误. 这…
这里有一条解决在SharePoint 2010搜索爬网时遇到的“拒绝访问错误”的小技巧. 首先要检查默认内容访问帐户是否具有相应的访问权限,或者添加一条相应的爬网规则.如果目标资源库是一个SharePoint库,验证一下该帐号是否具有对该SharePoint web应用程序具有至少“完全读取”的权限. 当我在升级上来的SharePoint环境中对我新建的博客URL进行爬网时遇到了这个错误. 这个错误发生在当你运行Windows 2008 R2和SharePoint 2010并且爬网进程试图访问一…
本文讲述SharePoint 2013/2010 在一个列表或文档库内移动列表项.文档和目录位置而保持last modify by 等系统字段保持不变的解决方式. 近期遇到客户一个需求,在一个列表或文档库内移动列表项,文档和目录位置而保持last modify by 等系统字段保持不变. 研究出来了.不敢独享.特此共享出来给同鞋们做參考: using Microsoft.SharePoint; using System; using System.Collections.Generic; usi…
In this lesson, you will learn how to make a List View editable. For this purpose, the DemoTask List View will be used. 在本课中,您将学习如何使列表视图可编辑.为此,将使用演示任务列表视图. Note 注意 Before proceeding, take a moment to review the following lessons. 在继续之前,请花点时间复习以下课程. S…
本文介绍如何手动删除某些搜索项目,其实删除搜索项目并不常用,主要还是在刚刚完成爬网,就删除了某些项目,然后有比较敏感需要马上删除的时候.下面,就跟着图文简单了解下手动删除已爬网的项目吧. 1.配置好搜索,搜索linyu,如下图: 2.进入管理中心,点击Manage service applications,如下图: 3.找到Search Service Application,点击进入,如下图: 4.进入Search Administration,我们可以管理搜索配置,如下图: 5.点击左侧菜单…
现象: 以前一直正常的爬网突然无法顺利完成,总是在进行到某个部分就停滞不前. 调查: 在查看了log文件后,发现了这条错误 06/24/2014 11:14:51.86   NodeRunnerQuery1-734f5ee7-2cc2- (0x0DD4)  0x14A0    Search                            Common Processing                28    Information   Component and System=Que…
Spider功能 Burp Spider爬网介绍 Burp Spider 是一个映射 web 应用程序的工具.它使用多种智能技术对一个应用程序的内容和功能进行全面的清查. 通过跟踪 HTML 和 JavaScript 以及提交的表单中的超链接来映射目标应用程序,它还使用了一些其他的线索,如目录列表,资源类型的注释,以及 robots.txt 文件. 结果会在站点地图中以树和表的形式显示出来,提供了一个清楚并非常详细的目标应用程序 视图.能使你清楚地了解到一个 web 应用程序是怎样工作的,让你避…
#coding=utf-8 ''' Created on 2013-7-17 @author: zinan.zhang ''' import re import time import httplib2 import urllib from bs4 import BeautifulSoup #路径 savePath = 'F://TDDOWNLOAD//aNO.4//' #获取url def url_xunhuan(url,list):     return url + list #下载图片的时…
Python目前是流行度增长最快的主流编程语言,也是第二大最受开发者喜爱的语言(参考Stack Overflow 2019开发者调查报告发布).笔者建议.NET.Java开发人员可以将Python发展为第二语言,一方面Python在某些领域确实非常犀利(爬虫.算法.人工智能等等),另一方面,相信我,Python上手完全没有门槛,你甚至无需购买任何书籍! 由于近期在筹备4.21的长沙开发者大会,耽误了不少时间.不过这次邀请到了腾讯资深技术专家..NET中国社区领袖,微软MVP张善友:52ABP开源…
python反反爬,爬取猫眼评分.解决网站爬取时,内容类似:$#x12E0;样式,且每次字体文件变化.下载FontCreator . 用FontCreator打开base.woff.查看对应字体关系 初始化时将对应关系写入字典中. #!/usr/bin/env python # coding:utf-8 # __author__ = "南楼" import requests import re import os from fontTools.ttLib import TTFont #…
爬网提示被拒绝,场管理员明明可以打开那个站点的,我初步怀疑是:环回请求(LoopbackRequest)导致的 解决方法就是修改环回问题.修改注册表 具体操作方法: http://www.c-sharpcorner.com/UploadFile/shyjumohan/disable-loop-back-check-in-windows-server-2012/…
[本文出自天外归云的博客园] 从64365网站获取全国各地律师电话号,用到了python的lxml库进行对html页面内容的解析,对于xpath的获取和正确性校验,需要在火狐浏览器安装firebug和firepath插件.页面内容如下(目标是爬“姓名+电话”): 代码如下: # coding:utf-8 from lxml import etree import requests,lxml.html,os class MyError(Exception): def __init__(self,…
1.问题描述 ​ 最近在做一个pyqt登录校园网的小项目,想在窗口的状态栏加上当天的天气情况,用爬虫可以很好的解决我的问题. 2.解决思路 ​ 考虑到所处位置的不同,需要先获取本地城市地址,然后作为中国天气网的输入,爬取指定城市的天气信息. ​ a. 先通过https://www.ip.cn/爬取本地城市名称 b. 再通过获取本地城市名称作为输入 进入城市页面获取所需信息即可,看起来不难,不就是爬.爬吗 3.思路实现 ​ a 很容易实现,直接上代码 target_url = 'https://w…
[本文出自天外归云的博客园] 1. 在安卓网上对热门机型进行爬网,取前五十: # -*- coding: utf-8 -*- import requests,re from bs4 import BeautifulSoup def get_rank_list(): s = requests.Session() rank_list = [] for pageNum in xrange(1,10): url = "http://product.hiapk.com/mobile/p"+str…
参考 一件有趣的事: 爬了爬自己的微信朋友 忘记从谁那里看到的了,俺也来试试 首先在annconda prompt里面安装了itchat包 pip install itchat 目前对python这里还不太熟,只能说,这是哪个大神写好的包呢?希望有一天俺也能自己写包,发包 在jupyter notebook上面完成的,这个小的记事本太好使了 安装完成后导入包,再登陆自己的微信.过程中会生产一个登陆二维码,扫码之后即可登陆.登陆成功后,把自己好友的相关信息爬下来 登录自己的微信,会自动弹出一个二维…
在创建外部列表过程中,往往需要添加筛选参数,而较多开发用户,会关心如何在外部列表中,只显示当前用户相关的行.本例子中,我们以任务数据表来做例子,看看如何实现这个需求. 1)数据表tbl_task: tbl_task数据: 数据表中,userid即为我们在sharepoint访问外部列表时,对当前用户筛选的字段.它的格式为hostname\username.大家按你们自己的实际情况填写即可. 2)创建外部列表 打开sharepoint designer,登陆sharepoint site 选择外部…
我们在使用sharepoint的过程中,发现一个比较好用的功能,就是“将此列表另存为模版”(save list as template),这个功能的作用是,创建一个和当前列表或者文档库一模一样的配置,例如字段或者文档类型. 在列表或者文档库的“库设置”中,高级设置,点击其中有一项“将此列表另存为模版” --------------------------------------------------------------------------------------------------…
1,由于目前的SharePoint网站需要部署到多个服务器上,每个网站的内容都不一样,所以使用备份还原是不可以的.常用的方式便是将列表导出为列表模版,然后将列表模版复制到服务器上,根据列表模版创建列表.由于网站中的列表比较多,需要部署多套项目,这项工作就变成了很无聊的一项工作.因此通过编程的方式自动创建所有列表. 2,请看代码(我是用控制台程序创建的列表) (1)主函数 static void Main(string[] args) { SPSecurity.RunWithElevatedPri…