gpt4 book ai didi

java - 在 UIMA Ruta Workbench 中添加 HeidelTime 作为分析引擎

转载 作者:行者123 更新时间:2023-11-30 02:15:09 25 4
gpt4 key购买 nike

我想在使用 UIMA Ruta 脚本添加和改进结果注释之前运行 HeidelTime。我当然可以从 Java 的管道中按顺序运行这些,但如果这可以从 UIMA Ruta Workbench 实现,那就更方便了。

据我了解UIMA Ruta Manual ,可以使用 UIMAFIT 关键字添加外部分析引擎。我一直在寻找将 HeidelTime 独立 JAR 添加到 CLASSPATH 的方法,但我一直无法让 UIMA Ruta Workbench 检测到 HeidelTime 分析器。

所以我的问题是:如何方便地将 HeidelTime 包含在 UIMA Ruta Workbench 的 UIMA Ruta 脚本中?请注意,我是 UIMA、UIMA Ruta 和 Eclipse 的新手。

最佳答案

首先是坏消息:您不能在 UIMA Ruta 中使用 HeidelTime 作为 uimaFIT 分析引擎,因为它不是 uimaFIT 组件。它实际上可以工作,但在这种情况下不会,因为 HeidelTime 的初始化()期间默认值的严格要求以及非字符串参数值的要求。 UIMA Ruta 不支持参数值的声明注入(inject)。它看起来像下面这样:

UIMAFIT de.unihd.dbs.uima.annotator.heideltime.HeidelTime(Language,german,Date,True,Time,True,Duration,True,Set,True,Temponym,False,Type,news);

好消息是,您可以通过分析引擎描述HeidelTime.xml来使用HeidelTime。然而,HeidelTime 有一些特殊的构建,UIMA Ruta 不支持,因此您需要一些定制。

为了从 Ruta 脚本中调用 HeidelTime,您需要做什么?有几种选择。这是我使用 UIMA Ruta Workbench 2.6.1 测试的一个:

  1. 将描述符 HeidelTime.xml 和 HeidelTime_TypeSystem.xml 复制到 Ruta 项目中的描述 rune 件夹中。
  2. 修改 HeidelTime.xml 描述符:重新链接类型系统导入以指向同一文件夹:<import location="HeidelTime_TypeSystem.xml"/>
  3. 可以选择对标记和句子的其他描述执行相同的操作
  4. 导入脚本中的所有描述并调用分析引擎,例如使用模拟的标记和句子:

    ENGINE HeidelTime;
    TYPESYSTEM HeidelTime_TypeSystem;
    ANY{-> Token};// mock tokenizer and sentence splitter
    (# PERIOD){-> Sentence};
    (PERIOD # PERIOD){-> Sentence};
    EXEC(HeidelTime, {Timex3});
    t:Timex3{t.timexType == "DATE"}; // do something with a date

为了使其工作,您需要做的最后一件事是将 HeidelTime 添加到脚本的启动委托(delegate)的类路径中。有两种选择:

  1. 将 HeidelTime 项目导入您的工作区并设置对其的引用。右键单击您的 Ruta 项目:弹出菜单 -> 属性 -> 项目引用 -> 检查 heideltime
  2. 将 HeidelTime Jar 直接添加到类路径中。选择“运行配置...”,选择您的脚本,切换到“类路径”选项卡并在其中添加 jar。

我会推荐选项 1,因为您无论如何都需要描述。

总的来说,我当然建议在 Java 管道中而不是在 Ruta 脚本中调用 HeidelTime。

免责声明:我是 UIMA Ruta 的开发者

关于java - 在 UIMA Ruta Workbench 中添加 HeidelTime 作为分析引擎,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48789167/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com