gpt4 book ai didi

Freebase - 如何使用 freebase-rdf-latest?

转载 作者:行者123 更新时间:2023-12-02 09:34:43 27 4
gpt4 key购买 nike

我从 freebase.com 下载了 freebase-rdf-latest。我将其解压缩,现在我有一个 380.7Gb 的文件。我怎样才能读取这些数据?您推荐我哪个程序?感谢您的帮助!

最佳答案

我不同意@Nandana,并说您绝对不应该将其加载到大多数用途的三重存储中。其中存在大量冗余,即使没有冗余,通常您也只对其中的一小部分感兴趣。

此外,对于大多数应用程序,您可能希望保留文件压缩状态。您解压缩它的速度可能比从文件系统读取未压缩版本的速度更快。如果您需要将其拆分以在 MapReduce 环境中进行处理,则该文件是(或至少曾经是)一系列串联的压缩文件,可以将其拆分而无需解压缩。

Nandana 对于考虑衍生数据产品有一个很好的建议。需要考虑的权衡是它们的更新频率以及它们的过滤/提取管道的透明度。

对于简单的任务,您可以使用 zgrep、cut 和相关的 Unix 命令行工具获取最新数据。

关于Freebase - 如何使用 freebase-rdf-latest?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28285043/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com