ruby - 使用 Ruby 的 UIMA？-6ren

ruby - 使用 Ruby 的 UIMA？

转载作者：太空宇宙更新时间：2023-11-03 16:09:28

25

4

我们正在研究使用 Ruby 进行一些NLP，采用多种文档格式并将它们用于相似性测试。

我们可以使用现有的部分，如 Standford Parser、ruby stemmer 等将其组合在一起，但 UIMA 似乎是一个工业强度的解决方案，包含文档导入和索引预处理。

有人用过吗？并特别尝试将其合并到 Ruby 中？

欢迎所有意见。

最佳答案

您可能想在 UIMA 和 expose UIMA as a REST service 中编写 NLP 管道.另一种解决方案是使用 JRuby。

关于ruby - 使用 Ruby 的 UIMA？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6848312/

25

4

0

文章推荐： paypal - 付款完成后，就称为销售？

文章推荐： php - Paypal 托管结帐页面不显示 Paypal 选项

uima - 是否可以测序-uima ruta
在 uima ruta 中是否可以进行排序。例如: 输入文件: some text Fig 1.1 Table 1.1 Fig 1.2 some text Pic 1.2 Table 1.2 some
uima - 词汇表-uima ruta
实际上我在Wordlist中使用了一些CITY名称和PUBLISHERS名称。在我的理解中，Wordlist会注释文档中任何列表项的所有出现。但是我发现一个问题，当我改变列表中文本的顺序。例如: 脚
uima - 是否可以使用 UIMA 创建注释层次结构？
我希望能够从不同的注释类型中获得一个共同的特征。是否可以创建注解的子类，然后由父类(super class)获取它们？这是我目前正在做的方式，但我希望能够获得通用的注释父类(super class)
uima - 单个词表的最大大小-UIMA RUTA
Uima Ruta 中单词表的最大大小是多少？因为我想存储国家、州和城市名称的列表。最佳答案 UIMA Ruta 中的词表没有最大大小。文件的行通常被传输到基于字符的内存树结构 (TRIE) 中。这
uima - 在 UIMA Ruta 中设置特征值为包含注解的计数
我有一个 RUTA 脚本，其中所有句子都用 Sentence 注释进行了注释，各种单词和短语都用它们自己的特定注释进行了注释。一切都按预期工作。这些注释中的每一个都具有包含它的句子索引的特征。所以在
uima - 我应该如何使用 UIMA Ruta 来匹配换行符之间的所有单词？
感谢任何有力的双手! 我有一些像下面这样的文字 aaaaa aaaa aaaaa aaaaaa bbbbb bbbbb bbbb bbbbbb cccccc ccccc ccccc cccccc 我想
hadoop - UIMA DUCC 与 Hadoop 上的 UIMA
我正在尝试设计一个基于 UIMA 的分布式可扩展管道。我应该如何决定在 Hadoop 上使用 UIMA DUCC 还是 UIMA？如果我在 UIMA DUCC 而不是 Hadoop 上构建它，反之亦然
uima - Uima Ruta 中的 Html Annotator，Html 转换器
任何人都可以通过一些示例简要说明 Html 注释器、Html 转换器和 TEIViewWriter。我想在初始 View 中创建注释。等待答案。主要脚本: PACKAGE uima.ruta.e
uima - 从 UIMAFIT SimplePipeline 运行 UIMA Ruta 脚本时出现 NoSuchMethodError
我正在尝试使用以下代码从 UIMAFIT 简单管道运行现有的 UIMA Ruta 分析引擎: File specFile = new File("MyEngine.xml"); XMLInputSou
apache - 文档不明确，使用以下之一代替 : org. apache.uima.ruta.type.Document uima.tcas.DocumentAnnotation
我正在使用 Ruta 注释框架来注释输入文本，之前我使用的是类路径中的 Ruta 脚本。但根据客户要求，我们必须将 Ruta 脚本移出代码之外，所有这些都需要与系统解耦。我可以实现这一切。我正在做的是
UIMA 正则表达式注释器
我是 UIMA 架构的新手。我下载了 UIMA SDK(http://uima.apache.org/downloads.cgi#Latest 官方发布)以及相应的 Eclipse 插件。能够成功运行
uima ruta 评分条件
我尝试了一个脚本来使用分数条件来标记日志。 W{REGEXP("Journal",true)->MARK(ONLY_Journal)}; W{REGEXP("Retraction|Retr
UIMA Ruta 单词表大小写忽略
我的用例是这样的，我在 WORDLIST“MonthNames.txt”中有一个匹配单词列表。现在我想标记给定文档中这些单词的所有出现，无论文本大小写如何。 PACKAGE uima.ruta.ex
UIMA Ruta 单词表大小写忽略
我的用例是这样的，我在 WORDLIST“MonthNames.txt”中有一个匹配单词列表。现在我想标记给定文档中这些单词的所有出现，无论文本大小写如何。 PACKAGE uima.ruta.ex
UIMA RUTA - 如何使用正则表达式和组进行查找和替换
这里是 RUTA 新手。我正在使用 RUTA 处理文档，并且在开始注释之前有很多规范化工作要做。我正在尝试找到使用正则表达式和组在 RUTA 中的原始文档上查找和替换字符序列的最佳方法。本质上，我试图
java - UIMA 注释功能是否有通用类型？
是否有一个泛型类型，类似于 Object在Java中，这将允许设置不同类型的值？ com.example.Annotation uima.tcas.Annotation
eclipse - UIMA 中的名称实体关系
我是 UIMA 的新手，目前我陷入以下情况。如何对从 UIMA 中的注释器获得的不同标记集进行分类和关联？就像个人实体 token 集名称(如 {John,Smith})和 Assets 实体集(如
java - UIMA 用于结构化数据
我是 UIMA 新手... 我想连接到数据库，提取数据并使用 UIMA 正则表达式注释器对其进行处理，然后写回数据库。示例: 表:emp Name Department Emp
java - 如何在文件列表上运行 UIMA？
我在 Java 程序中使用 org.apache.uima.examples.cpe.SimpleRunCPE，它采用 CpeDescription XML 文件作为输入。此文件有一个用于 Inpu
java - 用于解析电子邮件的 UIMA
我是 UIMA 的新手。我想使用 UIMA 和 uimaFIT 开发一个应用程序，可以解析与机票相关的任何电子邮件，例如确认电子邮件、取消电子邮件等，并从中提取有值(value)的信息，例如机票号码

首页

博学

6Ren·AI

商城

ruby - 使用 Ruby 的 UIMA？