gpt4 book ai didi

google-cloud-platform - JanusGraph 大规模数据摄取

转载 作者:行者123 更新时间:2023-12-03 20:51:27 26 4
gpt4 key购买 nike

我们正在使用 Python 在 Kubernetes(GCP)上的 Janusgraph 中摄取数据。我们正在做多线程、节点链接、索引,但我们仍然只能在 60 分钟内从 bigquery 摄取 100k(节点)记录。
Kubernetes 规范 - 1 个 Pod,具有 25 个 vCPU 和 150 GiB RAM
ids.block-size = 1000 万
线程池 - 16
节点池 - 16
堆大小 - 4 GB
问题:

  • 我们可以采取更多方法来提高摄取性能,从而减少总时间。
  • 我们可以通过 Python 驱动程序使用 Janusgraph 一次创建多少个多个连接。目前我们能够创建 30 个线程(连接),但是当我们增加线程数量时,连接要么卡住,要么性能下降。

  • 任何细节/帮助将不胜感激
    Gremlin 查询:gV().hasLabel("http://purl.uniprot.org/core/Helix_Annotation").has("id", "http://purl.uniprot.org/uniprot/P06931#SIPC5C5063B7561AB45") .has("node_id", "http://purl.uniprot.org/uniprot/P06931#SIPC5C5063B7561AB45").has("rdf_type", "http://purl.uniprot.org/uniprot/").has( "http://purl.uniprot.org/core/range", "http://purl.uniprot.org/range/22571007582875950tt125tt127").fold().coalesce(unfold(), addV("http://purl.uniprot.org/core/Helix_Annotation").property("id", "http://purl.uniprot.org/uniprot/P06931#SIPC5C5063B7561AB45").property("node_id", "http://purl. uniprot.org/uniprot/P06931#SIPC5C5063B7561AB45").property("rdf_type", "http://purl.uniprot.org/uniprot/").property("http://purl.uniprot.org/core/range ", "http://purl.uniprot.org/range/22571007582875950tt125tt127")).V().hasLabel("http://www.w3.org/1999/02/22-rdf-syntax-ns#Statement ").has("id", "http://purl.uniprot.org/uniprot/#_kb.P06931_up.annotation_FA85AD309172A9A7").has("node_id", "http://purl.uniprot.org/uniprot/#_kb.P0 6931_up.annotation_FA85AD309172A9A7").has("rdf_type", "http://purl.uniprot.org/uniprot/").has("http://purl.uniprot.org/core/attribution", "http:///purl.uniprot.org/uniprot/P06931#attribution-AE0E09C5B47CC2714C9061D3806995B4").fold().coalesce(unfold(), addV("http://www.w3.org/1999/02/22-rdf-syn) ns#Statement").property("id", "http://purl.uniprot.org/uniprot/#_kb.P06931_up.annotation_FA85AD309172A9A7").property("node_id", "http://purl.uniprot.org/uniprot/#_kb.P06931_up.annotation_FA85AD309172A9A7").property("rdf_type", "http://purl.uniprot.org/uniprot/").property("http://purl.uniprot.org/core/attribution ", "http://purl.uniprot.org/uniprot/P06931#attribution-AE0E09C5B47CC2714C9061D3806995B4"))

    最佳答案

    您是否尝试过使用 groovy 脚本?我能够在大约 10 秒的单线程中插入大约 5K 个节点到一个具有更少 RAM 和 CPU 的 janusgraph 中。

    关于google-cloud-platform - JanusGraph 大规模数据摄取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62587526/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com