作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个流行的社交游戏,为此我将每个用户操作作为一个事件实体存储在数据存储中,然后每天一次从 GAE 导出这些事件进行处理。现在我想从数据存储中删除所有这些实体,全部 3 亿个。
为此,我开始使用“数据存储管理”。在我让它运行的最初几个小时内,它设法删除了大约 200 万个实体并使用了 10 美元的 CPU 来执行此操作。因此,似乎仅运行此删除操作就要花费 1500 美元。我开始认为我最好删除整个应用程序并将我不想删除的项目复制到新应用程序。
还有其他选择吗?
更新
我在 IRC 的#appengine 上得到了一些建议,即一次简单地获取 2000 个实体的键并生成任务以将它们逐个删除(可以将键作为字符串传递给任务)可能比使用数据存储管理工具更便宜。我现在正在尝试这个,如果这看起来更便宜,我会尽量记得明天回来报告。
最佳答案
首先删除索引将大大降低删除记录的成本。您还可以将删除率限制在免费分配的每天 6.5 个 CPU 小时以下,以避免付费。
关于自己进行删除,您不太可能比数据存储管理工具更有效地执行此操作,后者已经执行仅键查询并使用游标。
关于python - 从 App Engine 经济地删除数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5252477/
大家好所有的图论专家:) 我目前正面临一个我自己无法解决的算法问题。 我必须在已经包含直接股份的有向图中找到每家公司彼此之间的所有间接股份(参见图片中的一个非常简单的示例)。 我必须从有向图开始,其中
我是一名优秀的程序员,十分优秀!