python - ndb 和一致性 : Why is happening this behavior in a query without a parent

转载作者：太空狗更新时间：2023-10-30 02:21:42

我正在使用 Python 和 ndb 做一些工作，但不明白为什么。我将发布上面的案例和代码:

模型.py

class Reference(ndb.Model):
  kind = ndb.StringProperty(required=True)
  created_at = ndb.DateTimeProperty(auto_now_add=True)
  some_id = ndb.StringProperty(indexed=True)
  data = ndb.JsonProperty(default={})

这些测试在交互式控制台和 dev_appserver.py 的 --high_replication 选项中运行:

测试 1

from models import Reference
from google.appengine.ext import ndb
import random

some_id = str(random.randint(1, 100000000000000))
key_id = str(random.randint(1, 100000000000000))

Reference(id=key_id, some_id=some_id, kind='user').put()
print Reference.query(Reference.some_id == some_id, Reference.kind == 'user').get()

# output:
# >> None

为什么？？？？现在，让我们在打印之前添加一个 sleep(1):

测试 2

from models import Reference
from google.appengine.ext import ndb
import random
from time import sleep

some_id = str(random.randint(1, 100000000000000))
key_id = str(random.randint(1, 100000000000000))

Reference(id=key_id, some_id=some_id, kind='user').put()
sleep(1)
print Reference.query(Reference.some_id == some_id, Reference.kind == 'user').get()

# output:
# >> Reference(key=Key('Reference', '99579233467078'), createdAt=datetime.datetime(2013, 1, 31, 16, 24, 46, 383100), data={}, kind=u'user', some_id=u'25000975872388')

K，假设它正在模拟将文档传播到所有 Google 表格的时间，我永远不会在我的代码中休眠，ofc。现在，让我们移除 sleep 并添加父对象!

测试 3

from models import Reference
from google.appengine.ext import ndb
import random
from time import sleep

some_id = str(random.randint(1, 100000000000000))
key_id = str(random.randint(1, 100000000000000))

Reference(id='father', kind='father').put()

Reference(parent=ndb.Key(Reference, 'father'), id=key_id, some_id_id=some_id, kind='user').put()
print Reference.query(Reference.some_id == some_id, Reference.kind == 'user', ancestor=ndb.Key(Reference, 'father')).get()

# output:
# >> Reference(key=Key('Reference', '46174672092602'), createdAt=datetime.datetime(2013, 1, 31, 16, 24, 46, 383100), data={}, kind=u'user', some_id=u'55143106000841')

现在很困惑!只需设置一个父级并给我很强的一致性!为什么？如果需要提供强一致性，为什么默认情况下将所有文档插入数据存储区时不让所有文档都具有相同的父文档？也许我做的完全错了，有办法做得更好。请有人指导我!

提前致谢

最佳答案

祖先查询在同一实体组中运行(因此在物理上接近)并且高度一致。

在测试 1 中，HRD 可能看不到 put()，因为它的分布式特性最终是一致的。

在测试 2 中，HRD 有足够的时间变得一致，因此您可以在查询中看到实体。

在测试 3 中，您将它放在同一个实体组中，因此它是高度一致的。

问:为什么不把所有东西都放在同一个实体组中？
A:除非有一堆实体组(然后他们可以将它们推送到大量不同的服务器)，否则 GAE 无法分发海量数据集。实体组应该和你需要的一样大，不要更大(G 有时使用将用户“消息”放在用户对象下的例子)。此外，由于写入实体组的成员会锁定整个组，因此您面临写入速度限制(如果我记得的话，例如 1 次写入/秒，Alfred 就此进行了讨论)。

问:我的 get() 没有得到对象，不是应该的吗？
A:不，只有按键获取是强一致的，你做了一个 query().get() 这实际上只是 LIMIT 1 的简写。

关于python - ndb 和一致性 : Why is happening this behavior in a query without a parent，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14630886/