gpt4 book ai didi

freebase - 从已弃用的 freebase 中查找所有实体名称

转载 作者:行者123 更新时间:2023-12-02 03:13:17 43 4
gpt4 key购买 nike

我正在训练一些将单词表示为向量的机器学习模型,使用 freebase 作为训练数据。由于 API 已被弃用,我正在使用原始的 freebase 转储,它现在是 31 亿个三元组的列表,包含超过 5 亿个不同的实体(主题/对象),我想减少这个数字。

我想删除所有仅表示主题名称的三元组,以便只保留包含 MID 的三元组。但是,我发现了多个可能的谓词来定义实体的“名称”。

i) common.notable_for.display_name
ii) type.object.name
iii)/rdf-schema#label

我有 3 个问题:

a) 上面的谓词有区别吗?
b) 是否还有额外的谓词也描述了实体的名称?
c) 除了定义名称的三元组之外,该名称是否曾经出现在其他三元组中,而不是 MID?

感谢您的帮助!

最佳答案

您应该只关注 type.object.name,它是保存主题名称的架构属性。

/rdf-schema#label 是均衡化,它不是 freebase 模式的一部分。

common.notable_for.display_name 描述是:“显着对象的本地化/性别适当的显示名称。”,它也是 CVT(复合值类型)中的一个属性,它拥有不同的信息类型:“在一个主题的所有类型中,最重要的是什么。据我所知,“拉里佩奇”是一位“企业家”。所以你不需要这个属性。专注于 TON type.object.name.

关于freebase - 从已弃用的 freebase 中查找所有实体名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38676338/

43 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com