gpt4 book ai didi

c# - 优化/自定义 Sharepoint 搜索爬行

转载 作者:太空狗 更新时间:2023-10-29 21:52:38 26 4
gpt4 key购买 nike

对于 SharePoint Server 2007,还有一个搜索功能和一个爬网程序。然而,Crawler 有一些局限性,因为它在爬取外部站点时仅支持 Basic Auth,并且无法告诉它忽略 no-index,no-follow 属性。

现在,我想为一个站点建立索引,不幸的是,该站点使用它自己的身份验证系统,并且在页面上使用 no-index,no-follow。当我控制该站点时,我可以删除属性,但这样做是一个 PITA。此外,它没有解决身份验证问题。

所以我想知道是否有可能以某种方式扩展 Sharepoint 的爬虫?

最佳答案

MOSS SP1 中应该已经解决了使用不同形式身份验证的 MOSS 爬网站点的限制。 :

http://www.microsoft.com/downloads/details.aspx?FamilyID=ad59175c-ad6a-4027-8c2f-db25322f791b&displaylang=en

这是一个帖子的链接,该帖子描述了如何获取 SP1 之前的 MOSS 的修补程序以启用使用表单例份验证的站点爬网:

http://blogs.microsoft.co.il/blogs/adir_ron/archive/2007/10/11/moss-search-for-sso-form-based-authentication-sites.aspx

希望对您有所帮助!

关于c# - 优化/自定义 Sharepoint 搜索爬行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35219/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com