- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
我正在尝试估算将返回大量结果的应用引擎查询的结果总量。
为了做到这一点,我为每个实体分配了一个介于 0 和 1 之间的随机 float 。然后我执行了我想用以下 3 个设置估计总结果的查询:
* I ordered by the random numbers that I had assigned in ascending order * I set the offset to 1000 * I fetched only one entity
然后我将为此目的分配的实体的随机值代入以下等式以估计总结果(因为我使用 1000 作为上面的偏移量,在这种情况下 OFFSET 的值将是 1000):
1 / RANDOM * OFFSET
这个想法是因为每个实体都有一个分配给它的随机数,并且我按该随机数排序,实体的随机数分配应该与结果的开始和结束相对于它的偏移量成比例(在这种情况下,1000)。
我遇到的问题是我得到的结果给了我低估。并且估计值越低,偏移量越低。我曾预计我使用的偏移量越低,估计值就越不准确,但我认为误差范围会高于和低于实际结果数。
下面的图表展示了我在说什么。如您所见,随着偏移量从 1000 增加到 5000,预测变得更加一致(准确)。但是随后预测可预测地遵循 4 部分多项式。 (y = -5E-15x4 + 7E-10x3 - 3E-05x2 + 0.3781x + 51608)。
我是不是在这里犯了一个错误,或者标准的 python 随机数生成器没有为此目的足够均匀地分配数字?
谢谢!
编辑:
原来这个问题是我的失误造成的。在程序的另一部分,我从系列的开头抓取实体,进行操作,然后重新分配随机数。这导致接近尾声的随机数分布更密集。
我进一步深入研究了这个概念,解决了问题,并在不同的查询上再次尝试(因此结果数量与上面不同)。我发现这个想法可以用来估计查询的总结果。需要注意的一件事是,“错误”对于附近的偏移量非常相似。当我在 excel 中绘制散点图时,我期望每个偏移量的预测准确度为“云”。这意味着在最开始的偏移量会产生更大、密度更低的云,随着偏移量变大,云会收敛到实际值周围非常小、密集的云。这不是发生的事情,正如您在下面的购物车中看到的那样,每个偏移量的预测有多远。我原以为会有一团团的点,但实际上是一条线。
这是每次偏移后的最大值图表。例如,10000 之后的任何偏移量的最大误差都小于 1%:
最佳答案
使用 GAE 时,不要尝试在读取上做大量工作更有意义 - 它是为非常快速的请求周转而构建和优化的。在这种情况下,在创建实体时维护结果计数实际上更有效。
如果您有标准查询,这相当简单 - 只需使用 sharded counter创建实体时。您可以使用 map reduce 作业对此进行播种以获得初始计数。
如果您有可能是动态的查询,这就比较困难。如果您知道可能执行的查询范围,您会希望为每个可能运行的查询创建一个计数器。
如果可能的查询范围是无限的,您可能需要考虑聚合计数器或以更有创意的方式使用它们。
如果您告诉我们您尝试运行的查询,可能会有人有更好的主意。
关于algorithm - 估算 Google App Engine 查询中的结果数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8723652/
这里的这个问题对 updating Google Sheets charts linked to Google slides 有一个简洁的解决方案. function onOpen() { var
我正在尝试将 Google 表单添加到 Google 类作业中,但似乎不可能。 首先,它在这里 ( https://developers.google.com/classroom/reference/
出于某种原因,无论我做什么以及我如何尝试,这个日期格式化程序都不起作用。工具提示仍然显示错误的格式。你可以试试代码here . 在代码中我必须注释掉 formatter.format(dataTabl
我目前正在使用访问 token 和刷新 token 从 Google Analytics Reporting API (v4) 中提取数据。当我致力于自动从 Google Analytics 中提取数
我已在 Google 云端硬盘中创建了一个文件夹,例如测试一下,放入3个文件 a.jpg, b.jpg, c.jpg 我希望在同一帐户下的 Google 电子表格中访问文件,例如生成图像文件的链接,可
电子表格 A 是欢迎新移民来到我们小镇的团队的主数据源。它里面有大量非常敏感的数据,不能公开,哪怕是一点点。 (我们谈论的是 child 的姓名和出生日期以及他们在哪里上学……保证电子表格 A 的安全
有没有办法在 Google 文档中编写 Google Apps 脚本以从 Google 表格中检索仅限于非空白行的范围并将这些行显示为表格? 我正在寻找一个脚本,用于使用 Google Apps 脚本
有没有办法在 Google 文档中编写 Google Apps 脚本以从 Google 表格中检索仅限于非空白行的范围并将这些行显示为表格? 我正在寻找一个脚本,用于使用 Google Apps 脚本
尝试检索存储在 google firebase 中名为条目的节点下的表单条目,并使用谷歌工作表中的脚本编辑器附加到谷歌工作表。 我已将 FirebaseApp 库添加到谷歌表脚本编辑器。然后我的代码看
是否可以将我的 Web 应用程序的登录限制为仅限 google 组中的帐户? 我不希望每个人都可以使用他们的私有(private) gmail 登录,而只能使用我的 google 组中的用户。 最佳答
我们想使用 Google 自定义搜索实现 Google 附加链接搜索框。在谷歌 documentation , 我发现我们需要包含以下代码来启用附加链接搜索框 { "@context"
我想将特定搜索词的 Google 趋势图表添加到我的 Google Data Studio 报告中,但趋势不是数据源列表中的选项。我也找不到嵌入 JavaScript 的选项。是否可以将趋势图表添加到
是否可以将文件从 Google Drive 复制到 Google Cloud Storage?我想它会非常快,因为两者都在类似的存储系统上。 我还没有看到有关无缝执行此操作的任何方法的任何信息,而无需
之间有什么区别 ga('send', 'pageview', { 'dimension1': 'data goes here' }); 和 ga('set', 'dimension1', 'da
我正在尝试记录每个博客站点作者的点击率。 ga('send', 'pageview'); (in the header with the ga code to track each page) ga(
我设置了 Google Tag Manager 和 2 个数据层变量:一个用于跟踪用户 ID,传递给 Google Analytics 以同步用户 session ,另一个用于跟踪访问者类型。 在使用
我在我们的网站上遇到多个职位发布的问题。 我们在加拿大多个地点提供工作机会。所有职位页面都包含一个“LD+JSON ”职位发布的结构化数据,基于 Google 的职位发布文档: https://dev
公司未使用 Google 套件,使用个人(消费者)帐户(甚至是 Google 帐户)违反公司政策。 需要访问 Google Analytics - 没有 Google 帐户是否可能? 谢谢 最佳答案
我想分析人们使用哪些搜索关键字在 Play 商店中找到我的应用。 那可能吗?我怎么能这样做? 最佳答案 自 2013 年 10 月起,您可以关联您的 Google Analytics(分析)和 Goo
Google Now 和 Google Keep 中基于时间和位置的提醒与 Google Calendar 事件提醒不同。是否有公共(public) API 可以访问 Now 和 Keep 中的这些事
我是一名优秀的程序员,十分优秀!