作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想索引包含汉字/单词的文档。在某些字段中,还有一些HTML标记。
我使用“html_strip”来避免对HTML进行索引,但是我的问题是文档与HTML一起存储在elasticsearch中。这是我的索引设置和映射:
PUT test
{
"settings" : {
"index" : {
"number_of_shards" : 1,
"number_of_replicas" : 0
},
"analysis": {
"analyzer": {
"ch_analyzer": {
"tokenizer": "icu_tokenizer",
"char_filter": [ "html_strip" ]
}
}
}
},
"mappings": {
"qa": {
"properties": {
"comment_desc": {
"type": "text",
"analyzer": "ch_analyzer"
},
"article_title": {
"type": "text",
"analyzer": "ch_analyzer"
},
"article_desc": {
"type": "text",
"analyzer": "ch_analyzer"
}
}
},
"sport": {
"properties": {
"title": {
"type": "text",
"analyzer": "ch_analyzer"
},
"content": {
"type": "text",
"analyzer": "ch_analyzer"
}
}
}
}
}
"<p><br/>台灣人,奧運直播,使用PPStream,(PPS網路電視),觀看同步奧運實況</b>!"
最佳答案
如果要在Elasticsearch上执行此操作(而不是作为预处理步骤),则必须使用ingest node。没有ingest processor可以完全满足您的要求,因此您必须使用脚本处理器或编写插件来完成此操作。
根据您的用例,在预处理步骤中进行此操作可能会更容易(使用您选择的语言编写代码)。
关于html - 如何在没有HTML的情况下在Elasticsearch中存储文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45914632/
我是一名优秀的程序员,十分优秀!