gpt4 book ai didi

java - BigQuery 分页 - 使用 pageToken 还是 startIndex?

转载 作者:行者123 更新时间:2023-12-02 09:54:03 27 4
gpt4 key购买 nike

我将在 BiqQuery 中获取大约 500,000 到 1,000,000 行。我们将其限制为偏移量和最大值。在本例中,pageSize = maxstartIndex = offset

我们的数据每天只会处理一次,然后上传到 BigQuery。

文档建议使用pageToken而不是startIndex。我使用 pageTokenstartIndex 进行了一些估计,但看不到任何时间差异。

我在 StackOverflow 找到了一个答案:

"You should use the page token returned from the original query response or the previous jobs.getQueryResults() call to iterate through pages. This is generally more efficient and reliable than using index-based pagination"

但是我不确信为什么我应该使用pageToken,那么我需要存储 token 以便在来回时使用它。从时间上看,我看不出有什么区别。

最佳答案

But I'm not convinced why I should use "pageToken"

两者之间有一些但很重要的区别

  • 基于索引的分页 - 当您知道从查询中返回了多少条记录并且不考虑记录的大小时,这是很好的选择(这对于客户端应用程序很重要

  • 页面 token - 结果集中的特定页面,不需要任何预先信息即可访问,例如结果的大小

因此,如果您知道有多少结果并且不关心页面大小,则可以使用基于索引的其他方式使用页面 token

关于java - BigQuery 分页 - 使用 pageToken 还是 startIndex?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56130612/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com