gpt4 book ai didi

Lucene 索引字段值被剥离所有 html 标签

转载 作者:行者123 更新时间:2023-12-04 19:43:08 25 4
gpt4 key购买 nike

我有一个 Lucene 索引,其中一个字段映射到 Sitecore 的富文本字段。

由于此字段值包含大多数共享模板的项目的 html 内容,因此我希望在获取项目的字段值时返回 html 内容。但是,我注意到返回的值去除了所有 html 标签。

我尝试将 INDEXTYPE 更改为“UNTOKENTIZED”。然而这并没有解决问题。我知道 Lucene 这样做是为了允许基于该字段进行搜索。但这在我的情况下不是必需的,我希望这种行为被覆盖。

最佳答案

这是因为有一个 RichTextFieldReader分配给 htmlrich text领域:

<fieldReader 
fieldTypeName="html|rich text"
fieldNameFormat="{0}"
fieldReaderType="Sitecore.ContentSearch.FieldReaders.RichTextFieldReader, Sitecore.ContentSearch" />

在 Sitecore 8.1 中,它在 Sitecore.ContentSearch.Lucene.DefaultIndexConfiguration.config 中定义.

它使用 HtmlField.GetPlainText() 去除所有标签.

您可以尝试添加与 <mapFieldByTypeName hint="raw:AddFieldReaderByFieldTypeName"> 相同级别的另一个部分部分并使用类似的东西:

<mapFieldByFieldName hint="AddFieldReaderByFieldName">
<fieldReader
fieldName="yourFieldName"
fieldReaderType="Sitecore.ContentSearch.FieldReaders.DefaultFieldReader, Sitecore.ContentSearch" />

fieldName 映射比按字段类型映射具有更高的优先级,因此它将使用 fieldRendered为您的字段指定,而不是使用为您的字段类型指定的字段。

关于Lucene 索引字段值被剥离所有 html 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37414203/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com