gpt4 book ai didi

java - 自定义属性如何在 Lucene 4 中工作?

转载 作者:行者123 更新时间:2023-11-30 11:39:59 25 4
gpt4 key购买 nike

如果我向 TokenStream 添加自定义属性(例如词性),它是否用于索引过程?

我可以从索引中检索这个属性吗?是否为每个 token 存储它?

最佳答案

如果我理解您在这里寻找什么,我认为您需要创建自己的自定义 TokenStream(我认为是对标准 TokenStream 的扩展)来完成此任务,并确定您希望如何存储所有这些额外信息。以及如何从索引中有意义地检索该信息。我不知道有什么方法可以开箱即用。

在我的脑海中,我认为您需要为通过自定义 token 流的每个 token 编写一个新文档。然后在搜索时,使用荧光笔或类似工具来获取查询匹配的术语,并再次查询索引以检索有关该术语的这些元数据文档。这假定任何由这个或另一个写入的文档重用的标记都将分配给它相同的元数据。如果不是这种情况,您将必须确定如何识别您要查找的对冲突不敏感的文档。

或者您可以编写同一文档的另一个字段,为与数据结构平行的每个标记创建元数据的有序列表。把两者都存起来,再次用高亮笔找到搜索到的结果,在你的tokenstream创建的列表中解析出匹配的位置。

好吧,无论如何这是一些想法。

关于java - 自定义属性如何在 Lucene 4 中工作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12958804/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com