gpt4 book ai didi

java - 如何使用 IBM Content Analytics 访问自定义 uima 注释器中的文档文件名或 URL?

转载 作者:行者123 更新时间:2023-11-30 06:39:55 25 4
gpt4 key购买 nike

我正在为 Watson Explorer Content Analytics 中的 UIMA 管道编写自定义 Java 注释器。

有两个地方(据我所知)可以尝试获取当前正在处理的文档的 URL 或文件名。

初始化

public class CustomAnnotator extends JCasAnnotator_ImplBase {

@Override
public void initialize(UimaContext aContext)
throws ResourceInitializationException {
super.initialize(aContext);
.... HERE MAYBE ? ....

或者

流程

@Override
public void process(JCas jcas) throws AnalysisEngineProcessException {
try {
.... HERE ....

我尝试了几种选择:

  • 通过初始化方法中的上下文(在服务器上运行管道,例如我可以获得 PearID),
  • 通过 process 方法中的 Sofa(例如 jcas.getSofa().getSofaURI())

我还发现了SourceDocumentInformation ,但这只是一个示例,尽管方法 getUri() 看起来很有前途,但我依赖 IBM 来实现 setUri(String) 方法...

但到目前为止我还没有成功,我希望我忽略了一些东西......

最佳答案

我在 IBM dwanwsers 上问了同样的问题。简而言之,当管道在 Watson Explorer Content Analytics 服务器中运行时,您可以访问多个 View 。对于元数据,我们需要检查 _InitialView 而不是 rlw-view,后者保存了您在 Content Analytics Studio 中创建的自定义管道创建的所有注释更多详细信息可以在这里找到,也可以查看回复! https://www.ibm.com/developerworks/community/blogs/ibmandgoogle/entry/Exporting_annotations_from_Watson_Explorer_Content_Analytics?lang=en

关于java - 如何使用 IBM Content Analytics 访问自定义 uima 注释器中的文档文件名或 URL?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44548049/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com