- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是Elasticsearch的新手,正在尝试进行一些测试,但是,在使用(在这种情况下)法语分析器和停用词方面,我遇到了一个问题。这是我设置的索引:
test1: {
state: open
settings: {
index.analysis.analyzer.french.tokenizer: standard
index.analysis.filter.stop_fr.stopwords.0: _french_
index.analysis.filter.stop_fr.type: stop
index.analysis.analyzer.french.filter.1: stop_fr
index.analysis.analyzer.french.filter.0: lowercase
index.analysis.analyzer.french.type: custom
index.number_of_shards: 5
index.number_of_replicas: 1
index.version.created: 900299
}
最佳答案
您还应该更改索引映射设置。
索引由default_analyzer自动分析,这当然会删除英语停用词。具有两种类型的信息content
和time
的示例映射
"testindex": {
"testtype": {
"search_analyzer": "test_analyzer", // <-- search_analyzer
"properties": {
"content": {
"type": "string",
"store": true,
"analyzer": "test_analyzer" // <-- index_analyzer
},
"time": {
"type": "date",
"store": true,
"format": "dateOptionalTime"
}
}
}
}
关于elasticsearch - Elasticsearch外语停用词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17910563/
例如,日语、unicode 或 HTML 编码的属性中的字符串的正确格式是什么? 例如,其中哪一个使用正确? title=パートナー
现在我正在使用 spring 框架 + java + mysql(maria db)执行 select query(for searching) 时,没有问题但是当用韩语 (utf-8) 词搜索时那个
我的目标是编写某种会说西类牙语的聊天机器人。我见过简单的 python 聊天机器人的示例,但它们的答案大多只是随机的。我希望机器人能够部分理解问题并制定回应,例如 http://cleverbot.c
我正在尝试开发一个从段落中提取主题标签的函数,基本上是以#开头的单词 (#cool #life #cars #سيارات) 我已经尝试了几种方法,例如使用 split() 和使用正则表达式,但没有尝
我希望检索字符串中包含的工作日的下一个可能日期。复杂之处在于这个工作日将使用外语(sv_SE)。 在 bash 中我可以使用“dateround”解决这个问题: startdate=$(daterou
我需要在高级 PDF 上显示数据,其中字段包含英文和中文字符。英文显示正常,但中文不出现。有哪些选项可以让汉字也出现? 最佳答案 NetSuite 在后台使用名为 BFO 的库来呈现 PDF。 Use
是否可以重新发布具有不同标题的现有 iOS 应用程序? 该应用程序支持多种语言,但在应用商店中只有一个英文标题。我的想法很可能是任性的,我的潜在俄罗斯/印度/中国/法国观众看不到它。 听起来不像是 A
我是一名优秀的程序员,十分优秀!