gpt4 book ai didi

sharepoint-2010 - FAST For SharePoint Web 爬虫元标记提取

转载 作者:行者123 更新时间:2023-12-04 07:01:34 26 4
gpt4 key购买 nike

我正在使用 FAST For SharePoint 来抓取非 SharepPoint 网站。网站抓取没有错误,我可以得到任何关键字的结果。

我想通过 html 页面元标记在结果页面上创建精简器。必须有二级精炼机;类别和子类别。如果用户单击类别,精简器面板必须显示所有相关的子类别。

像这样的元标记:

<meta name="Category" content="Products"/>
<meta name="SubCategory" content="Electronic"/>

我如何提取使用 FAST For SharePoint Webcrawler 抓取 html 页面的元标记?

我尝试将元标记名称添加到 FAST Search Administration > Managed Properties 并为这些元标记配置精简面板,但无法获得结果。它不起作用。

谢谢!

最佳答案

如果您想使用自定义托管属性,您需要先将它们绑定(bind)到一个已爬网属性。爬取的属性在爬取期间自动创建,或者您可以在 powershell 中创建它们,请参见以下链接:http://msdn.microsoft.com/en-us/subscriptions/ff393776(v=office.14).aspx

如果我理解得很好,您正在尝试做的是获取页面 HTML 中的信息。在这种情况下,您无法使用开箱即用的网络爬虫来获取此信息。如果您想创建自定义爬虫以获取所需信息,我建议您查看自定义 BDC 连接器:http://msdn.microsoft.com/en-us/library/ee557349(v=office.14).aspx

关于sharepoint-2010 - FAST For SharePoint Web 爬虫元标记提取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6779185/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com