gpt4 book ai didi

neo4j - Cypher 计算模式中的多个节点

转载 作者:行者123 更新时间:2023-12-05 01:24:07 27 4
gpt4 key购买 nike

我的 Neo4j 实例上的 Cypher 查询有问题。

我有以下图形结构:

(d:Document)-->(t:Token)-->(l:Lemma)

Document 可以与许多 Token 有传出关系,而 Token 总是来自文档的一个传入关系。一个 Token 总是只有一个与引理的传出关系,而引理可以有多个传入关系来自代币。

所以基数是[Document]-n-1-[Token]-1-m-[Lemma]

我想,对于给定列表 documentIds 中的每个文档,计算不同标记的数量和 Lemmata 在这种模式下,将后者与前者分开。这应该考虑到每个引理都可以连接到模式中的多个标记,这些 Lemmata 不应被计算为多个次。

到目前为止,我的查询如下所示:

MATCH (d:DOCUMENT)--(t:TOKEN)--(l:LEMMA)
WHERE d.id in {documentIds}
WITH d, count(DISTINCT l)/count(DISTINCT t) AS ttr
RETURN d.id AS id, ttr

我觉得这计算了文档中的 Lemmata 和 Tokens,而不是分别计算每个文档。同样在我的结果中,对于每个 d.idttr 都是 0.0

我不知道是否有办法为您提供我的数据库内容。是查询中有明显的错误吗?

编辑:
我创建了一个控制台。 http://console.neo4j.org/r/yqtrbx

在这种情况下,有两个文档的 token 共享一个共同的引理。对于此图,我希望 ID 为 10023 的文档的结果为 2/3,ID 为 10050 的文档的结果为 2/2。在完整文档中, token 计数和引理计数之间的差异通常要高得多。

最佳答案

您遇到的问题与您将两个整数相除并得到一个整数作为结果有关。这样除法 2/3 将导致零而不是预期的 0.66。要解决此问题,只需将其中一个整数转换为 float 即可:

match (d:DOCUMENT)-->(t:TOKEN)-->(l:LEMMA)
with d, count(distinct l) as cl, count(distinct t) as ct
return d, cl, ct, cl / toFloat(ct)

结果将是(基于您的数据集):

╒════════════╤════╤════╤══════════════════╕
│"d" │"cl"│"ct"│"cl / toFloat(ct)"│
╞════════════╪════╪════╪══════════════════╡
│{"id":10050}│2 │2 │1 │
├────────────┼────┼────┼──────────────────┤
│{"id":10023}│2 │3 │0.6666666666666666│
└────────────┴────┴────┴──────────────────┘

关于neo4j - Cypher 计算模式中的多个节点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48340979/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com