gpt4 book ai didi

nlp - 句子的 RDF 表示

转载 作者:行者123 更新时间:2023-12-04 17:05:18 28 4
gpt4 key购买 nike

我需要以 RDF 格式表示句子。

换句话说,“约翰喜欢可乐”将自动表示为:

Subject : John
Predicate : Likes
Object : Coke

有谁知道我应该从哪里开始?是否有任何程序可以自动执行此操作,或者我需要从头开始做所有事情?

最佳答案

看起来您想要 类型依赖 一个句子,例如为 John likes coke :

 nsubj(likes-2, John-1)
dobj(likes-2, coke-3)

我不知道有任何直接生成 RDF 的依赖项解析器。但是,它们中的许多以标准化的制表符限制表示形式生成解析,称为 CoNLL-X ,并且从 CoNLL-X 转换为 RDF 应该不会太难。

开源依赖解析器

有许多解析器可供选择来提取类型依赖,包括以下最先进的开源选项:
  • Stanford Parser - 见 online demo .
  • MaltParser
  • MSTParser

  • 斯坦福解析器 包括一个用于解析英语的预训练模型。要获取类型化的依赖项,您需要使用标志 -outputFormat typedDependencies .

    对于 MaltParser 您可以下载英文模型 here .

    MSTParser 包括一个小的 200 句英语训练集,您可以使用它来创建自己的英语解析模型。但是,对这些小数据进行训练会损害结果解析器的准确性。因此,如果您决定使用此解析器,最好使用可用的预训练模型 here .

    上面链接的所有预训练模型都根据斯坦福依赖形式主义( ACL papermanual )生成解析。

    在这三个中,Stanford Parser 是最准确的。 MaltParser 是最快的,这个包的一些配置能够解析 1800 sentences in only 8 seconds .

    关于nlp - 句子的 RDF 表示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2705888/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com