algorithm - 估算 Google App Engine 查询中的结果数-6ren

algorithm - 估算 Google App Engine 查询中的结果数

转载作者：塔克拉玛干更新时间：2023-11-03 02:57:19

31

4

我正在尝试估算将返回大量结果的应用引擎查询的结果总量。

为了做到这一点，我为每个实体分配了一个介于 0 和 1 之间的随机 float 。然后我执行了我想用以下 3 个设置估计总结果的查询:

 * I ordered by the random numbers that I had assigned in ascending order * I set the offset to 1000 * I fetched only one entity

然后我将为此目的分配的实体的随机值代入以下等式以估计总结果(因为我使用 1000 作为上面的偏移量，在这种情况下 OFFSET 的值将是 1000):

1 / RANDOM * OFFSET

这个想法是因为每个实体都有一个分配给它的随机数，并且我按该随机数排序，实体的随机数分配应该与结果的开始和结束相对于它的偏移量成比例(在这种情况下，1000)。

我遇到的问题是我得到的结果给了我低估。并且估计值越低，偏移量越低。我曾预计我使用的偏移量越低，估计值就越不准确，但我认为误差范围会高于和低于实际结果数。

下面的图表展示了我在说什么。如您所见，随着偏移量从 1000 增加到 5000，预测变得更加一致(准确)。但是随后预测可预测地遵循 4 部分多项式。 (y = -5E-15x4 + 7E-10x3 - 3E-05x2 + 0.3781x + 51608)。

我是不是在这里犯了一个错误，或者标准的 python 随机数生成器没有为此目的足够均匀地分配数字？

谢谢!

enter image description here

编辑:

原来这个问题是我的失误造成的。在程序的另一部分，我从系列的开头抓取实体，进行操作，然后重新分配随机数。这导致接近尾声的随机数分布更密集。

我进一步深入研究了这个概念，解决了问题，并在不同的查询上再次尝试(因此结果数量与上面不同)。我发现这个想法可以用来估计查询的总结果。需要注意的一件事是，“错误”对于附近的偏移量非常相似。当我在 excel 中绘制散点图时，我期望每个偏移量的预测准确度为“云”。这意味着在最开始的偏移量会产生更大、密度更低的云，随着偏移量变大，云会收敛到实际值周围非常小、密集的云。这不是发生的事情，正如您在下面的购物车中看到的那样，每个偏移量的预测有多远。我原以为会有一团团的点，但实际上是一条线。

enter image description here

这是每次偏移后的最大值图表。例如，10000 之后的任何偏移量的最大误差都小于 1%:

enter image description here

最佳答案

使用 GAE 时，不要尝试在读取上做大量工作更有意义 - 它是为非常快速的请求周转而构建和优化的。在这种情况下，在创建实体时维护结果计数实际上更有效。

如果您有标准查询，这相当简单 - 只需使用 sharded counter创建实体时。您可以使用 map reduce 作业对此进行播种以获得初始计数。

如果您有可能是动态的查询，这就比较困难。如果您知道可能执行的查询范围，您会希望为每个可能运行的查询创建一个计数器。

如果可能的查询范围是无限的，您可能需要考虑聚合计数器或以更有创意的方式使用它们。

如果您告诉我们您尝试运行的查询，可能会有人有更好的主意。

关于algorithm - 估算 Google App Engine 查询中的结果数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/8723652/

31

4

0

文章推荐： java - 用于基于 map 调用 Java setter 的 Clojure 宏？

文章推荐： Java 字符串池和类型转换

node.js - MAC OS X "open APP.app"和 "APP.app/content/MacOs/APP"shell 脚本之间的差异
如果我调用一个应用程序两次或多次，但只有一个实例应该运行(这是所需的)，我就会遇到一个问题。首先一些(可能必要的)背景信息: 使用 MAC OS X El Capitan (10.11.6) 我有一
google-apps-script - 使用 Apps 脚本代码用另一个 Apps 脚本文件更新(覆盖)一个 Apps 脚本文件
覆盖文件。覆盖 Apps 脚本文件。这是不是创建一个新的 Apps 脚本文件的问题。那对我没有帮助。我需要更新现有的 Apps 脚本文件。这个问题类似于创建一个新文件，但不是同一个问题。更新的语
google-apps-script - 从另一个 Apps Script 项目运行 Apps Script Web App 时如何以编程方式进行身份验证
我是 Apps 脚本的新手，正在尝试了解使用另一个帐户在一个帐户中运行/触发脚本的基础知识。需要注意的是:我想在访问脚本的用户而不是拥有脚本的用户的情况下运行脚本——以便将运行时间分配给访问的用户。
google-apps-script - 从另一个 Apps Script 项目运行 Apps Script Web App 时如何以编程方式进行身份验证
我是 Apps 脚本的新手，正在尝试了解使用另一个帐户在一个帐户中运行/触发脚本的基础知识。需要注意的是:我想在访问脚本的用户而不是拥有脚本的用户的情况下运行脚本——以便将运行时间分配给访问的用户。
android - APP URI for app Indexing an android app
我有一个安卓应用程序。我想为我的应用程序实现 App Indexing。我已经点击了 Google 开发者链接 https://developers.google.com/app-indexing/
javascript - import App from '../components/App' 有什么区别？和 var App = require ('../components/App' );?
有什么区别: import App from '../components/App'; 和 var App = require('../components/App'); 两者都用于获取组件，但它没有
javascript - RequireJS 搜索 app.app 而不是 app.js(其中 app.js 是 data-main 中指定的入口点)
问题: 我有一个使用 requireJS 的简单演示应用程序。当require.min.js脚本加载时，它尝试加载入口点脚本。但是，问题是，而不是 localhost:8090/js/app.js它尝
android - React-Native: "FirebaseError: No Firebase App ' [默认 ]' has been created - call Firebase App.initializeApp() (app/no-app)"
我正在构建一个 React Native 应用程序，目前正在尝试通过 Firebase Auth 实现一个身份验证注册系统。我已经按照指南/网站上的文档来设置 Firebase 配置文件。我运行该应用
google-app-engine - Google App Engine app.yaml 网址映射
因此 app.yaml 文件的一部分如下所示(至少在 GAE 教程中): handlers: - url: /.* script: main.app 但是，我也看到它看起来像这样: handler
android - 信息:Gradle任务[:app:generateDebugSources，:app:generateDebugAndroidTestSources，:app:createMockableJar]
我是Android App开发的新手。当我尝试创建一个新项目Android Project时，弹出以下消息: Information:Gradle tasks [:app:generateDebugS
google-apps-script - Google App Script Web App 上的并发点击或同时执行的数量是否有限制
我正在编写一个应用程序脚本(用于处理电子邮件、任务和日历事件)并希望将其部署为网络应用程序。该应用程序将在运行它的用户的上下文中运行。该应用程序将被超过 10k+ 的用户使用，甚至可能更多。在将其
google-apps-script - Google Apps Script Web App 在外部网站上进行身份验证
我需要实现一个用于登录网站的 Google Apps 脚本应用，然后如果该网站上的身份验证过程成功，用户应该会在 google 脚本边栏中收到一条消息。例如:用户输入他的邮箱和密码，然后他点击登录按
android - 如何在iOS App 中使用Google In-App Purchase 系统使用在Android App 中购买的数字项目？
我正在开发一个跨平台应用程序，它将在 Google Play 商店和 App Store 上发布。 Google Play 政策以及 App Store 政策规定，您不能使用其他支付系统购买将在应用程
google-app-engine - App Engine 忽略我的源代码更新和我的 app.yaml 文件
我的 AppEngine 应用程序在我的台式机上的开发服务器上运行良好，但我无法在 Google 服务器上获取版本以关注我的源代码更新。这是最有说服力的例证。我的 app.yaml 文件开始于: a
google-app-engine - 上传属性 Google App Engine - app.yaml
我像这样将所有内容重定向到我的 app.yaml 中的单个文件 - url: /.* script: frontcontroller.application 但我仍然必须使用 robots.txt
google-app-engine - Google App Engine : one app, 多个域
我想构建一个基于 App Engine 的网络应用程序，并使用 Google 帐户对用户进行身份验证。我需要来自多个域的用户可以登录。从我读到的内容看来，仅使用 Google Accounts API
google-app-engine - Google Apps 域上的 Google App Engine
我无法将我的域指向我使用 Google App Engine 托管的网站。这是背景……注意区分“google apps”(域托管、电子邮件等)和“google app engine”(网站框架)的概念
google-app-engine - 使用 Google Apps + App Engine 进行单点登录
是否可以通过 App Engine 上内置的 OpenId 实现单点登录？我一直在尝试集成一个 Marketplace 应用程序，并让用户在来自 Google Apps(管理面板或通用导航)时登录。我
azure-web-app-service - 从 azure-cli 向 Web App 或 Function App 添加 App Insights 支持
有没有办法从 azure-cli 为 Web 应用或函数应用创建和/或激活 App Insights？现在浏览文档。最佳答案我之前也考虑过你的问题。要创建应用程序洞察力，az resource
angular - ng new hello 错误 : Path "/app/app.module.ts" does not exist. 路径 "/app/app.module.ts"不存在
我在以 Angular 创建新项目时遇到问题。当我运行 ng new myapp 命令时，我得到以下命令 ng 新问候语 Error: Path "/app/app.module.ts" does n

首页

博学

6Ren·AI

商城

algorithm - 估算 Google App Engine 查询中的结果数