gpt4 book ai didi

lucene - 使用 'whitespace'分析器创建索引

转载 作者:行者123 更新时间:2023-12-02 23:04:51 26 4
gpt4 key购买 nike

我正在尝试初始化将使用空白分析器的基本索引,而我只是想确认自己是否正确执行了此操作

curl -XPUT localhost:9200/test -d '{
"settings" : {
"index" : {
"analysis": {
"analyzer": {
"whitespace": {
"type": "whitespace",
"tokenizer": "whitespace"
}
}
}
}
}
}'

当我这样做时
{"ok":true,"acknowledged":true}

但是,如果我随后转到 http://localhost:9200/_plugin/head/,然后在“操作”下拉列表中选择文本为“this is a test”的“Test Analyzer”,则它仅返回一个 token “test”。

最佳答案

直接分析仪测试将默认为标准分析仪。而是编写一个custom_analyzer并使用analytics api在索引上对其进行测试。您编写的分析仪不是自定义分析仪,也不是默认分析仪。您也可以将分析仪设置为默认分析仪。

将空白分析器设置为默认分析器:

curl -XPUT localhost:9200/test -d '{
"settings" : {
"index" : {
"analysis": {
"analyzer": {
"default": {
"type": "whitespace",
"tokenizer": "whitespace"
}
}
}
}
}
}'

将空白分析器设置为自定义分析器:
curl -XPUT localhost:9200/test -d '{
"settings" : {
"index" : {
"analysis": {
"analyzer": {
"myAnalyzer": {
"type": "custom",
"tokenizer": "whitespace"
}
}
}
}
}
}'

如何测试它们?

在特定索引上测试默认分析器:
curl -XGET 'localhost:9200/test/_analyze?text=this+is+a+test'

在特定索引上测试自定义分析器:
curl -XGET 'localhost:9200/test/_analyze?analyzer=myAnalyzer' -d 'this is a test'

关于lucene - 使用 'whitespace'分析器创建索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21532578/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com