gpt4 book ai didi

grails - 如何在ElasticSearch的精彩集锦中过滤掉(损坏的)HTML标签?

转载 作者:行者123 更新时间:2023-12-02 14:49:18 25 4
gpt4 key购买 nike

我在使用ElasticSearch Grails插件时遇到了麻烦,
即突出显示功能。

它正在返回带有HTML标签的文本,这不是什么大问题,但是它也返回了损坏的,截断的HTML标签。

即“href=google.de> Link <a

使用RegEx不能轻易将其过滤掉。

解决方案似乎是这样的自定义分析器:

'{
"index" : {
"analysis" : {
"analyzer" : {
"test_1" : {
"char_filter" : [
"html_strip"
],
"tokenizer" : "standard"
},
"test_2" : {
"filter" : [
"standard",
"lowercase",
"stop",
"asciifolding"
],
"char_filter" : [
"html_strip"
],
"tokenizer" : "standard"
}
}
}
}
}'

HTML Strip in Elastic Search

问题是如何将以上内容导入GRAILS elasticsearch插件?
(或与此相关的任何其他解决方案)

最佳答案

尝试使用:
“片段数”:0

这将返回所有内容

关于grails - 如何在ElasticSearch的精彩集锦中过滤掉(损坏的)HTML标签?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42004164/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com