gpt4 book ai didi

file - Freebase 中所有标题/主题标题的文本文件

转载 作者:行者123 更新时间:2023-12-04 04:45:27 25 4
gpt4 key购买 nike

我需要一个文本文件来包含 .txt 文件中每个主题的每个标题/每个项目的标题,每个标题都在自己的行上。

如果我已经下载了 freebase rdf 转储,我该怎么做或做这个?

如果可能,我还需要一个单独的文本文件,每个主题/项目的描述在一行上,每个描述在自己的行上。

我该怎么做?

如果有人可以帮助我从 Freebase rdf 转储制作这些文件中的任何一个,我将不胜感激。

提前致谢!

最佳答案

过滤谓词/属性上的 RDF 转储 ns:type.object.name .如果您只想要一种特定的语言,也可以按该语言进行过滤,例如@en .

编辑:我也错过了关于需要描述的第二部分。这是一个由三部分组成的正则表达式,它将为您提供所有行:

  • 英文名称
  • 英文说明
  • 一种/common/topic

  • 将三者结合起来作为练习留给读者。
    zegrep $'\tns:(((type\\.object\\.name|common\\.topic\\.description)\t.*@en)|type\\.object\\.type\tns:common\\.topic)\\.$' freebase-rdf-2013-06-30-00-00.gz | gzip > freebase-rdf-2013-06-30-00-00-names-descriptions.gz

    它似乎有一个性能问题,我必须看看。在我的笔记本电脑上,整个文件的简单 grep 大约需要 11 分钟,但这已经运行了好几次。不过以后我得看...

    关于file - Freebase 中所有标题/主题标题的文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18263401/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com