gpt4 book ai didi

apache - UIMA ruta 中的模糊性

转载 作者:行者123 更新时间:2023-12-01 06:00:51 25 4
gpt4 key购买 nike

在单词匹配或忽略某些特殊情况的情况下,是否有任何模糊选项。
例如:

STRINGLIST AMIMALLIST = {"LION","TIGER","MONKEY"};
DECLARE ANIMAL;


Document {-> MARKFAST(ANIMAL, AMIMALLIST, true)};
我需要将单词与列表匹配,以防我遇到一些特殊字符,例如
老虎- 猴子$
根据 documentation有不同的评估者知道如何使用吗?
或者我可以使用 评分 MARKSCORE

最佳答案

这里有几个方面需要考虑。一般来说,UIMA Ruta 不支持字典查找中的模糊性。 SCOREMARKSCORE是可用于在顺序规则中引入一些启发式评分(不是真正的模糊性)的语言元素。在您在问题中给出的示例中,您实际上并不需要模糊匹配。

UIMA Ruta 中的字典查找适用于 RutaBasic 注释。这些注释由 UIMA Ruta 本身自动创建和维护(不应由其他分析引擎或规则直接更改)。 RutaBasic 注释表示注释所指的最小片段。默认情况下,RutaEngine 的播种器为单词( W -> CWSWCAP )和许多其他标记(如 SPECIAL)创建注释对于 - 或 $。这意味着还有一个 RutaBasic 注释,并且字典查找可以区分这些标记。结果, Tiger 和 Monkey 应该被注释掉,你问题中的例子应该确实有效 (我测试过)。您可能需要一些后期处理才能包含 SPECIALANIMAL .

我不得不提到还有使用 的功能。编辑距离在字典查找中(多树单词列表,TRIE)。但是,此功能已多年未得到维护。它还应该支持特定替换的不同权重。我不知道这是否算作模糊。

免责声明:我是 UIMA Ruta 的开发人员

关于apache - UIMA ruta 中的模糊性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45708526/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com