- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我在示例短语上构建了一些自定义注释以识别关键字。我现在遇到的问题是我无法组合这些注释来构建注释的上层模式。
例如。这些短语是:1.“我要买鸡蛋。”2.“我想吃早餐吃面包。”3.“我早餐想吃鸡蛋。”
DECLARE Annotation Eggs;
Entity{FEATURE("text","eggs")->MARK(Eggs)};
DECLARE Annotation Breakfast;
Entity{FEATURE("text","breakfast")->MARK(Breakfast)};
我如何构建一个新的注释,它结合/合并两个已经构建的注释并识别第三个短语?我已经尝试过下面的类型,但它不起作用:
DECLARE Annotation EggsForBreakfast;
Entity{AND(CONTAINS(Eggs),CONTAINS(Breakfast))->MARK(EggsForBreakfast)};
最佳答案
最后一个规则中的 CONTAINS 检查匹配项中是否有这些注释,即 Entity。你需要的是:
Document{CONTAINS(Eggs),CONTAINS(Breakfast)->MARK(EggsForBreakfast)};
您可以使用不同的语言元素来设计这些模式,例如带有通配符的顺序规则、内联规则和各种条件,如上例所示。最佳解决方案取决于实际用例,例如,我们是否包含 block 或语法树之类的结构?
免责声明:我是 UIMA Ruta 的开发者
关于java - UIMA RUTA - 如何组合注释?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48359908/
在 uima ruta 中是否可以进行排序。例如: 输入文件: some text Fig 1.1 Table 1.1 Fig 1.2 some text Pic 1.2 Table 1.2 some
实际上我在Wordlist中使用了一些CITY名称和PUBLISHERS名称。在我的理解中,Wordlist会注释文档中任何列表项的所有出现。但是我发现一个问题,当我改变列表中文本的顺序。 例如: 脚
我希望能够从不同的注释类型中获得一个共同的特征。是否可以创建注解的子类,然后由父类(super class)获取它们? 这是我目前正在做的方式,但我希望能够获得通用的注释父类(super class)
Uima Ruta 中单词表的最大大小是多少?因为我想存储国家、州和城市名称的列表。 最佳答案 UIMA Ruta 中的词表没有最大大小。文件的行通常被传输到基于字符的内存树结构 (TRIE) 中。这
我有一个 RUTA 脚本,其中所有句子都用 Sentence 注释进行了注释,各种单词和短语都用它们自己的特定注释进行了注释。一切都按预期工作。 这些注释中的每一个都具有包含它的句子索引的特征。所以在
感谢任何有力的双手! 我有一些像下面这样的文字 aaaaa aaaa aaaaa aaaaaa bbbbb bbbbb bbbb bbbbbb cccccc ccccc ccccc cccccc 我想
我正在尝试设计一个基于 UIMA 的分布式可扩展管道。我应该如何决定在 Hadoop 上使用 UIMA DUCC 还是 UIMA?如果我在 UIMA DUCC 而不是 Hadoop 上构建它,反之亦然
任何人都可以通过一些示例简要说明 Html 注释器、Html 转换器和 TEIViewWriter。我想在初始 View 中创建注释。 等待答案。 主要脚本: PACKAGE uima.ruta.e
我正在尝试使用以下代码从 UIMAFIT 简单管道运行现有的 UIMA Ruta 分析引擎: File specFile = new File("MyEngine.xml"); XMLInputSou
我正在使用 Ruta 注释框架来注释输入文本,之前我使用的是类路径中的 Ruta 脚本。但根据客户要求,我们必须将 Ruta 脚本移出代码之外,所有这些都需要与系统解耦。我可以实现这一切。我正在做的是
我是 UIMA 架构的新手。我下载了 UIMA SDK(http://uima.apache.org/downloads.cgi#Latest 官方发布)以及相应的 Eclipse 插件。能够成功运行
我尝试了一个脚本来使用分数条件来标记日志。 W{REGEXP("Journal",true)->MARK(ONLY_Journal)}; W{REGEXP("Retraction|Retr
我的用例是这样的,我在 WORDLIST“MonthNames.txt”中有一个匹配单词列表。 现在我想标记给定文档中这些单词的所有出现,无论文本大小写如何。 PACKAGE uima.ruta.ex
我的用例是这样的,我在 WORDLIST“MonthNames.txt”中有一个匹配单词列表。 现在我想标记给定文档中这些单词的所有出现,无论文本大小写如何。 PACKAGE uima.ruta.ex
这里是 RUTA 新手。我正在使用 RUTA 处理文档,并且在开始注释之前有很多规范化工作要做。我正在尝试找到使用正则表达式和组在 RUTA 中的原始文档上查找和替换字符序列的最佳方法。本质上,我试图
是否有一个泛型类型,类似于 Object在Java中,这将允许设置不同类型的值? com.example.Annotation uima.tcas.Annotation
我是 UIMA 的新手,目前我陷入以下情况。 如何对从 UIMA 中的注释器获得的不同标记集进行分类和关联?就像个人实体 token 集名称(如 {John,Smith})和 Assets 实体集(如
我是 UIMA 新手... 我想连接到数据库,提取数据并使用 UIMA 正则表达式注释器对其进行处理,然后写回数据库。 示例: 表:emp Name Department Emp
我在 Java 程序中使用 org.apache.uima.examples.cpe.SimpleRunCPE,它采用 CpeDescription XML 文件作为输入。 此文件有一个用于 Inpu
我是 UIMA 的新手。 我想使用 UIMA 和 uimaFIT 开发一个应用程序,可以解析与机票相关的任何电子邮件,例如确认电子邮件、取消电子邮件等,并从中提取有值(value)的信息,例如机票号码
我是一名优秀的程序员,十分优秀!