gpt4 book ai didi

freebase - 使用 freebase 进行命名实体识别

转载 作者:行者123 更新时间:2023-12-02 21:54:34 26 4
gpt4 key购买 nike

我了解 DBPedia Spotlight 对给定文档进行命名实体识别。为此,它使用存储在文件系统中的下载的 DBPedia 文件。请参阅 URL:https://github.com/dbpedia-spotlight/dbpedia-spotlight/wiki/Run-from-a-JAR

我需要的是 Freebase 的等效 API,例如聚光灯。尽管我浏览过,但我找不到任何在 Freebase 三重存储上运行的此类工具/API。有人可以帮忙吗?

最佳答案

目前 Freebase 中没有用于命名实体识别的等效项目。然而,Freebase 在 sameAs.org 上有 DBpedia 的链接。因此您可以使用 DBpedia Spotlight,然后将 ID 解析回 Freebase(该数据也可以在 Freebase RDF dumps 中找到)。

如果您正在寻找该领域的编码项目,我认为应该可以调整 DBpedia Spotlight 代码,以便您可以使用 Freebase 数据训练其模型。这样做的主要好处是 Freebase 比 DBpedia 涵盖更广泛的实体,因此您可以更好地记忆。此外,您还可以利用 Freebase 中的其他数据(例如“值得注意的类型”)来获得更好的精度。

通过查看 Freebase 中的/type/object/name 和/common/topic/alias 属性,您应该能够获得实体的一组良好的“表面形式”。与 Wikipedia 页面对应的任何 Freebase 实体都将在/wikipedia/en 命名空间中具有一个或多个/type/object/key 值。这些对应于 Wikipedia 页面名称(和重定向),这将允许您解析 Wikipedia XML 转储并识别页面上的哪些链接对应于 Freebase 主题。 Freebase key 编码方案描述 here .

您可能还对 OpenCalais 感兴趣和 AlchemyAPI它们提供命名实体识别服务,并在其 API 响应中提供 Freebase ID。

关于freebase - 使用 freebase 进行命名实体识别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20796266/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com