- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用 FAST For SharePoint 来抓取非 SharepPoint 网站。网站抓取没有错误,我可以得到任何关键字的结果。
我想通过 html 页面元标记在结果页面上创建精简器。必须有二级精炼机;类别和子类别。如果用户单击类别,精简器面板必须显示所有相关的子类别。
像这样的元标记:
<meta name="Category" content="Products"/>
<meta name="SubCategory" content="Electronic"/>
我如何提取使用 FAST For SharePoint Webcrawler 抓取 html 页面的元标记?
我尝试将元标记名称添加到 FAST Search Administration > Managed Properties 并为这些元标记配置精简面板,但无法获得结果。它不起作用。
谢谢!
最佳答案
如果您想使用自定义托管属性,您需要先将它们绑定(bind)到一个已爬网属性。爬取的属性在爬取期间自动创建,或者您可以在 powershell 中创建它们,请参见以下链接:http://msdn.microsoft.com/en-us/subscriptions/ff393776(v=office.14).aspx
如果我理解得很好,您正在尝试做的是获取页面 HTML 中的信息。在这种情况下,您无法使用开箱即用的网络爬虫来获取此信息。如果您想创建自定义爬虫以获取所需信息,我建议您查看自定义 BDC 连接器:http://msdn.microsoft.com/en-us/library/ee557349(v=office.14).aspx
关于sharepoint-2010 - FAST For SharePoint Web 爬虫元标记提取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6779185/
我是一名优秀的程序员,十分优秀!