gpt4 book ai didi

sorting - 在 MarkLogic 中排序时如何忽略 "stop words"?

转载 作者:行者123 更新时间:2023-12-01 23:28:31 25 4
gpt4 key购买 nike

有没有办法在排序时忽略“停用词”

例如:我有这样的话

dixit

单例

标记逻辑

降序顺序排序,结果应该是singla, marklogic, dixit

如上例所示, 被忽略。

有什么办法可以实现吗?

更新:

停用词可以出现在任何地方。例如

MarkLogic

MarkLogic 是最好的

MarkLogic 很棒

排序时不要考虑文本中的任何停用词。

以上只是一个小例子来描述问题。

实际上我使用的是 search:search API。对于排序,我使用了 sort-order 搜索选项。我必须对其执行排序的元素是动态的。大约有 30-35 个元素。

有什么方法可以在这个级别自定义排序规则,比如配置一些在排序时将被忽略的词(停用词)。

最佳答案

没有标准的归类 URI 可以为您执行此操作(至少我从未见过)。当然,您可以通过对函数调用的结果进行排序来动态执行此操作,但是如果您希望大规模有效地执行此操作(并且可用于 search:search),那么您需要具体化可排序的字符串到您的文档中。我经常将此作为元素的属性来完成:

<title sortable="Great Gatsby, The">The Great Gatsby</title>

然后在 title/@sortable 属性上放置一个范围索引。

您还可以使用“信封模式”,其中像这样的物化元数据在其自己的文档部分中维护,而原始数据保存在其自己的部分中。对于这样的事情,我认为直接装饰元素更优雅一些,以保持上下文。

关于sorting - 在 MarkLogic 中排序时如何忽略 "stop words"?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44263945/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com