SharePoint 搜索爬网第三方网站配置

news/2024/5/16 20:43:06/文章来源:https://linyu.blog.csdn.net/article/details/9252067

      介绍:SharePoint的搜索着实强大,而且最近用到SharePoint搜索第三方爬网,感觉收获挺大,而且网上资料没找到太多类似的,就小记录一下,分享给大家。

      首先,我自己写了一个net页面,里面读取所有我需要内容,充当SharePoint爬网的数据源,对这个页面进行爬网,页面如下图:

      然后,打开SharePoint管理中心,搜索设置,新建内容源Crawl,爬网http://moss:9000,如下图。爬网设置可以按照自己的需要进行设置,比如想要爬网页面深度,可以进行设置,我的爬网,只是爬网页面下面的链接,所以深度设置为1;设置完成,先不要爬网,还需要设置爬网规则。

设置爬网规则:

      打开爬网规则,设置路径,我的路径是9000端口下的所有页面,所以设置为http://moss:9000/*,当然,你的规则应该按照需要进行设置,可以排除这些路径,也可以包含这些路径,同时,如果有爬网到的任何结果,都可以在这里进行排除。

      特别的是,我的页面上的链接,包含“?”问号,所以勾选了对复杂的URL进行爬网,下面的指定认证,可以选择认证的账号,如果需要Form认证的网页,可以设置指定其他内容访问账户【特别:如果登录需要验证码的,SharePoint是无法爬网的】。设置完爬网规则,点击确定保存,然后可以对Crawl内容源进行完全爬网了。

对Crawl内容源进行完全爬网,查看爬网日志,如下图: 

在SharePoint搜索页面上,试试搜索刚配置的内容源,如下图:

搜索结果:

注意事项:

1、  如果,服务器处于代理访问网站的情况,需要配置管理中心的代理,位置在 搜索管理 - 代理服务器和超时 -  管理中心URL/_admin/searchfarmsettings.aspx

2、  搜索爬网内容,可能会出现异常情况,可以尝试重置搜索内容,位置在 搜索管理 - 重置所有已爬网内容,重置一下搜索结果。

3、  爬网结果,搜索出来的结果,标题为搜索页面的Html的页面Title,内容为页面上的Body内容,链接为URL。

4、  同样的搜索配置,可以搜索新浪,搜狐等网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_843492.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SharePoint 2010 类似人人网站内信功能实施

简介:用SharePoint代码加实施的方式,完成类似人人网站内信功能,当然,实现的比较简单,样式也比较难看,只为给大家一个实施的简单思路,如有谬误,还请见谅。当然,还有就是截…

SharePoint 2013 新建网站集图解

前言:接触SharePoint的人可能是越来越多,但是很多人一接触就很迷茫,在技术群里问如何新建网站集,这样一篇图解,帮助新手学习在搭建好SharePoint环境之后,如何创建一个网站集,做一个基本的参考&a…

SharePoint 2013 图文开发系列之网站栏

网站栏的本质,就是一个xml的描述文件,所以创建过程,基本就是通过Feature部署一个Xml文件,然后修改Xml文件的网站栏描述。 1、添加新项目,选择SharePoint 2013 空项目,如下图: 2、选择调试网站和…

SharePoint 使用PowerShell恢复误删的网站集

在SharePoint网站集的使用中,我们很有可能会误删我们需要的网站集,SharePoint其实并没有把网站集删掉,只是放到了SPDeletedSite中,这样,我们还可以通过PowerShell找回来我们误删的网站集,具体操作详见下面介…

SharePoint 2013跨网站集发布功能简介

在SharePoint Server 2013网站实施中,我们经常会遇到跨网站集获取数据,而2013的这一跨网站集发布功能,正好满足我们这样的需求。 使用SharePoint 2013中的跨网站发布,我们可以使用列表和其他库来存储在发布网站上重复使用的内容&a…

SharePoint 2013 对象模型操作网站设置菜单

在SharePoint的开发中,经常会有客户提到网站操作上的栏目过多,其实,我们除了可以通过Feature的方式添加,还可以通过服务器端对象模型的方式添加;下面,让我用简单的例子,给大家介绍一下&#xff…

SharePoint Online 创建门户网站系列之准备篇

前 言门户是SharePoint自推出以来,就非常适合的一种站点类型,在Server版本中,发布站点的应用非常广泛。这里,我们以一个个简单的例子,然后以一个固定的项目Demo,为大家演示如何一步步在SharePoint Online中…

SharePoint Online 创建门户网站系列之母版页

前 言虽然SharePoint中母版页看起来只是头部Banner和底部版权信息这两个部分,但是实质在SharePoint Online中的页面模型中占有重要地位,而且SPO对母版页有着完善的签入签出机制和版本控制,方便使用。同时,除了保持网站所有页面的一…

SharePoint Online 创建门户网站系列之首页布局

前 言SharePoint Online中创建首页布局,一般都是首先将美工提供的效果图,切图成为Html Css Script的形式,然后,将所有资源文件传到SharePoint Online的资源库,在Designer中创建页面,添加Html页面&#xf…

SharePoint Online 创建门户网站系列之导航

前 言关于SharePoint Online中的导航,基本是由Html Css JavaScript组成效果以及样式,然后在后台列表或者SharePoint Online元数据导航当做数据源进行展示,通常数据源为列表的我们称之为自定义导航。下面,让我们分别介绍SharePoi…

SharePoint Online 创建门户网站系列之图片滚动

前 言创建SharePoint Online栏目我们之前已经介绍过了,具体就是内容编辑器方式、自带WebPart方式和JavaScript读取后台数据前台做展示的三种;但是,对于复杂的展示来说,这些方式还是会比较难以实现&#x…

SharePoint Online 创建门户网站系列之创建栏目

前 言SharePoint Online的栏目,简单描述即显示在首页上的各个模块信息,这里,我们主要介绍我们首页上的栏目,包括简介类型、新闻列表类型、图片类型;下面,让我们开始在SharePoint Online的门户网…

SharePoint Online 创建门户网站系列之定制栏目

前 言SharePoint Online自带的库就带有二级页面和详细页面,也就是Allitems页面和DispForm页面,但是实在不够美观,尤其对于门户网站这一企业门面来说,更是无法接受。下面,我们就开始学习如何定制SPO的二级页…

SharePoint 2013 重命名网站集名称(SharePoint 2013 rename site collection)

最近使用SharePoint中,遇到一个需要重命名网站集的需求,主要是网站用数据库备份/还原的方式,想要改网站集的地址,然后搜了一下PowerShell:$site Get-SPSite -Identity "http://server/sites/Demo" $site.re…

SharePoint 2013 网站搜索规则的使用示例

前言SharePoint 2013搜索中,有一个非常好用的细化搜索结果的功能,就是“查询规则”。可以通过对于某些特定查询时,起到细化显示结果的作用。下面,我们简单的介绍一下该功能的使用和效果。 1、通常SharePoint搜索,我们在…

SharePoint Online 建站实战教程(上)-杨建宇-专题视频课程

SharePoint Online 建站实战教程(上)—1983人已学习 课程介绍 本次课程以Office 365 企业版 E3为环境,介绍如何使用其中SharePoint Online产品相关技术,如何通过站点配置和Designer设计,通过和工作流相结合&#xf…

SharePoint Online 建站实战教程(中)-杨建宇-专题视频课程

SharePoint Online 建站实战教程(中)—446人已学习 课程介绍 本次课程以Office 365 企业版 E3为环境,介绍如何使用其中SharePoint Online产品相关技术,如何通过站点配置和Designer设计,通过和工作流相结合&#xff…

SharePoint Online 建站实战教程(下)-杨建宇-专题视频课程

SharePoint Online 建站实战教程(下)—287人已学习 课程介绍 本次课程以Office 365 企业版 E3为环境,介绍如何使用其中SharePoint Online产品相关技术,如何通过站点配置和Designer设计,通过和工作流相结合&#xff…

SharePoint Online 创建网站集

前言本文介绍如何在Office 365中创建SharePoint网站集。正文通过登录地址登录到Office 365环境中,我们可以在左上角的按钮中点开,进入管理员,也可以直接在页面中点击管理;登录地址:https://login.microsoftonline.com在…

SharePoint Online 设置网站集

前言本文介绍如何在Office 365中设置SharePoint Online网站集,当我们创建好SharePoint Online站点,开始使用之前,一定会有一些基本的设置,本文就为大家介绍这些基本的设置。正文通过登录地址登录到Office 365环境中的SharePoint O…