作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
是否有任何开箱即用的词干提取算法可以将y从字尾删除?如果不是,通常如何处理时髦=时髦?
最佳答案
我会坚持使用lovins
英文stem filter。您可以通过以下设置来设置映射:
curl -XPUT http://localhost:9200/my_test_01 -d '
{
"settings": {
"analysis": {
"analyzer" : {
"my_analyzer" : {
"tokenizer" : "standard",
"filter" : ["standard", "lowercase", "my_stemmer"]
}
},
"filter" : {
"my_stemmer" : {
"type" : "stemmer",
"name" : "lovins"
}
}
}
},
"mappings": {
"stem": {
"properties": {
"name": {
"type": "text",
"analyzer": "my_analyzer"
}
}
}
}
}'
funky
-> funk
funny
-> fun
generally
-> general
prohibitively
-> prohibit
singlehandedly
-> singlehanded
nifty
-> nift
关于elasticsearch - 如何删除从词尾删除y的自定义词干?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43054580/
我认为正则表达式有问题:我想要一个字符串,它可以包含第一个圆括号中的所有字符,最后是一个 [,最后是一个]。正则表达式如下: var pattern = /^(([a-zA-Z0-9\.\_\
我是一名优秀的程序员,十分优秀!