R 3.4.1 - RSiteCatalyst 排队报告智能使用 while 循环-6ren

R 3.4.1 - RSiteCatalyst 排队报告智能使用 while 循环

转载作者：行者123 更新时间：2023-12-01 03:19:58

实际的
我一直在使用RSiteCatalyst现在打包一段时间。对于那些不了解它的人来说，它使通过 API 从 Adobe Analytics 获取数据的过程变得更加容易。
到目前为止，工作流程如下:

发出请求，例如:

    key_metrics <- QueueOvertime(clientId, dateFrom4, dateTo,
                   metrics = c("pageviews"), date.granularity = "month",
                   max.attempts = 500, interval.seconds = 20)

等待将保存为 data.frame 的响应(示例结构):

> View(head(key_metrics,1)) 
    datetime      name         year   month   day    pageviews 
  1 2015-07-01    July 2015    2015   7       1      45825

做一些数据转换(例如:key_metrics$datetime <- as.Date(key_metrics$datetime)

这个工作流的问题是有时(由于请求的复杂性)，我们可以等待很多时间直到响应最终到来。如果 R 脚本包含 40-50 个同样复杂的 API 请求，这意味着我们将等待 40-50 次，直到数据最终到来，我们才能发出新的请求。这显然在我的 ETL 过程中产生了引导。
目标
但是有一个参数 enqueueOnly在包的大多数功能中，它告诉 Adobe 在提供报告 ID 作为响应的同时处理请求:

key_metrics <- QueueOvertime(clientId, dateFrom4, dateTo,
               metrics = c("pageviews"), date.granularity = "month",
               max.attempts = 500, interval.seconds = 20,
               enqueueOnly = TRUE)

> key_metrics
[1] 1154642436

通过使用以下函数，我可以随时获得“真实”响应(带有数据):

key_metrics <- GetReport(key_metrics)

在每个请求中，我都添加了参数 enqueueOnly = TRUE在生成报告 ID 和报告名称列表时:

queueFromIds <- c(queueFromIds, key_metrics)
queueFromNames <- c(queueFromNames, "key_metrics")

这种方法最重要的区别是我的所有请求都由 Adobe 同时处理，因此等待时间大大减少。
问题
但是，我在有效获取数据方面遇到了问题。我正在尝试 while一旦获得数据，循环从先前的向量中删除键 ID 和键名称:

while (length(queueFromNames)>0)
{
  assign(queueFromNames[1], GetReport(queueFromIds[1],
                                      max.attempts = 3,
                                      interval.seconds = 5))
  queueFromNames <- queueFromNames[-1]
  queueFromIds <- queueFromIds[-1]
}

但是，这仅适用于请求足够简单以在几秒钟内处理的情况。当请求足够复杂以至于无法在 3 次尝试中以 5 秒的间隔处理时，循环将停止并出现以下错误:

Error in ApiRequest(body = toJSON(request.body), func.name ="Report.Get", : ERROR: max attempts exceeded forhttps://api3.omniture.com/admin/1.4/rest/?method=Report.Get

哪些函数可以帮助我控制所有 API 请求都被正确处理，并且在最好的情况下，需要额外时间(它们会生成错误)的 API 请求会被跳过，直到循环结束，当它们再次出现时要求？

最佳答案

我使用几个函数来独立生成/检索报告 ID。这样，处理报告所需的时间并不重要。我通常会在生成报告 ID 12 小时后回来接他们。我认为它们会在 48 小时左右后过期。这些功能当然依赖于 RSiteCatalyst。以下是功能:

#' Generate report IDs to be retrieved later
#'
#' @description This function works in tandem with other functions to programatically extract big datasets from Adobe Analytics.
#' @param suite Report suite ID.
#' @param dateBegin Start date in the following format: YYYY-MM-DD.
#' @param dateFinish End date in the following format: YYYY-MM-DD.
#' @param metrics Vector containing up to 30 required metrics IDs.
#' @param elements Vector containing element IDs.
#' @param classification Vector containing classification IDs.
#'@param valueStart Integer value pointing to row to start report with.
#' @return A data frame containing all the report IDs per day. They are required to obtain all trended reports during the specified time frame.
#' @examples
#' \dontrun{
#' ReportsIDs <- reportsGenerator(suite,dateBegin,dateFinish,metrics, elements,classification)
#'}
#' @export
    reportsGenerator <- function(suite,
                                 dateBegin,
                                 dateFinish,
                                 metrics,
                                 elements,
                                 classification,
                                 valueStart) {

      #Convert dates to date format.
      #Deduct one from dateBegin to
      #neutralize the initial +1 in the loop.

      dateBegin <-  as.Date(dateBegin, "%Y-%m-%d") - 1
      dateFinish <-  as.Date(dateFinish, "%Y-%m-%d")
      timeRange <- dateFinish - dateBegin

      #Create data frame to store dates and report IDs
      VisitorActivityReports <-
        data.frame(matrix(NA, nrow = timeRange, ncol = 2))
      names(VisitorActivityReports) <- c("Date", "ReportID")

      #Run a loop to retrieve one ReportID for each day in the time period.
      for (i in 1:timeRange) {
        dailyDate <- as.character(dateBegin + i)
        print(i) #Visibility to end user
        print(dailyDate) #Visibility to end user
        VisitorActivityReports[i, 1] <- dailyDate


        VisitorActivityReports[i, 2] <-
          RSiteCatalyst::QueueTrended(
            reportsuite.id = suite,
            date.from = dailyDate,
            date.to = dailyDate,
            metrics = metrics,
            elements = elements,
            classification = classification,
            top = 50000,
            max.attempts = 500,
            start = valueStart,
            enqueueOnly = T
          )
      }
      return(VisitorActivityReports)
    }

您应该将前一个函数的输出分配给一个变量。然后将该变量用作以下函数的输入。还将reportsRetriever 的结果分配给一个变量。输出将是一个数据框。只要它们都共享相同的结构，该函数就会将所有报告绑定(bind)在一起。不要尝试连接具有不同结构的报表。

#' Retrieve all reports stored as output of reportsGenerator function and consolidate them.
#'
#' @param dataFrameReports This is the output from reportsGenerator function. It MUST contain a column titled: ReportID
#' @details It is recommended to break the input data frame in chunks of 50 rows in order to prevent memory issues if the reports are too large. Otherwise the server or local computer might run out of memory.
#' @return A data frame containing all the consolidated reports defined by the reportsGenerator function.
#' @examples
#' \dontrun{
#' visitorActivity <- reportsRetriever(dataFrameReports)
#'}
#'
#' @export    

reportsRetriever <- function(dataFrameReports) {

      visitor.activity.list <- lapply(dataFrameReports$ReportID, tryCatch(GetReport))
      visitor.activity.df <- as.data.frame(do.call(rbind, visitor.activity.list))

      #Validate report integrity

      if (identical(as.character(unique(visitor.activity.df$datetime)), dataFrameReports$Date)) {
        print("Ok. All reports available")
        return(visitor.activity.df)
      } else {
        print("Some reports may have been missed.")
        missingReportsIndex <- !(as.character(unique(visitor.activity.df$datetime)) %in% dataFrameReports$Date)

        return(visitor.activity.df)
      }

    }

关于R 3.4.1 - RSiteCatalyst 排队报告智能使用 while 循环，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46276766/

文章推荐： r - R Shiny 中 html 小部件之间的交互

文章推荐： python - Twisted HTTP 客户端访问对端IP(服务器)

文章推荐： jquery - 如何在 Jquery 函数中访问模型数组

java - 捕获的屏幕截图附加到本地 Cucumber 报告，但不附加到 Jenkins 报告
@After public void afterScenario() { if (ScenarioManager.getScenario().isFailed()) {
mysql - Grails + BIRT 报告 - 将月份和年份作为日期传递到 BIRT 报告
我已将 BIRT 报告集成到 Grails 中并设计了一份报告。我的 grails 应用程序中有一个名为 startPeriod (仅限月份和年份)的参数，我想将其传递给 BIRT。然后 BIRT 调
oracle - 将 Oracle 报告 (.rdf) 转换为 BIRT 报告
我有一些 Oracle 报告 (.rdf)，正在考虑将其转换为 BIRT 报告。有没有办法将 .rdf 文件转换为 BIRT 报告设计文件？最佳答案完全自动化的解决方案可能是不可能的。您可以部分自
gcc - 为什么 gcc 4.1 + gcov 报告 100% 的分支覆盖率和更新的(4.4、4.6、4.8)报告 "p = new class;"行的 50%？
当 gcc 4.1(使用 gcov)下一行: p = 新类；报告为 100% 分支覆盖率为什么？因为启用了异常处理!!! 为了解决此问题，请指定: -fno-exceptions 在 g++
Bugzilla 报告
真的有好免费 BugZilla 报告工具？我发现 Web 界面上的默认搜索选项太有限了。我最大的问题是缺少 Order By 选项(一次只有 1 个字段，可供选择的字段集非常有限)。我已经做了一些谷
ColdFusion 报告
是否可以在 CFMX7 上运行 ColdFusion Report builder 生成的报告？更明确地说，是否可以将 CF7 中的报告生成引擎更改为 CF8？最佳答案我猜这可能很难做到。我记得
报告：2025年智能家居市场的机会将达到1190亿美元
根据Lucintel发布的新市场报告，智能家居市场的未来看起来很有吸引力，在家用安全、家电、娱乐、照明、HVAC、医疗保健和厨房应用中将带来许多机遇。由于COVID-19导致的全球经济衰退，
PHPCodeSniffer HTML 报告？
PHPCodeSniffer 是否生成 HTML 报告？如果不是呢？怎么办？目前，我可以运行 PHPCodeSniffer，但它只生成 XML 文件并在终端中显示结果。如何在 phpunit 中
PHPUnit 报告 PHPUnit_Framework_Exception
我在一个包中添加了一个简单的测试。按照手册中的建议，我尝试让 PHPUnit 加载配置: phpunit -c /app phpunit.xml 看起来像这样:
报告 R 中两个数据框之间的差异
我有两个从 csv 文件加载的数据框。基本上来自不同的环境但格式/列相似，它们的行/值可能有所不同。我想找到差异并在新的数据框中创建它们。两个数据框也将具有相同的顺序。我有 100 个要比较的文件。提
JUnit 报告——测试方法描述
我想看看是否有办法通过 javadoc 在我的 junit 报告中包含“描述性文本”。 JUnit 4 似乎不像 TestNG 那样支持 @Test 注释的“描述”属性。到目前为止，我所研究的只有一
Java Struts 报告
我正在使用操作、 Controller 、servlet struts 框架编写 Excel 报告。该报告非常拥挤，已经有大约 10 个单独的查询。由于报告发生变化，我需要再添加大约 10 个查询。有
OpenERP Jasper 报告
在放弃 Syleam 的 openerp jasper 模块后，我在 Nan Tic 的 jasper_reports 模块上苦苦挣扎。它一直给我一个错误: File "C:\Program Fil
php - 按每天按每月计数生成统计数据/报告
我希望创建一个简单的日历。每天由编码器生成条目计数并以日历样式查看。如一月、二月等。或按月显示全年。 database have date_added and encoder columns 我在将它
MySQL 报告 - 订单历史记录
我必须为报告创建 MySQL 查询。我有一个表history，它记录产品订单的状态更改。我有订单生命周期(订单流程)的以下状态:新、已确认、正在处理、已发货、已交付、已取消、已退回。订单不一定遵循此
mysql - 多个查询合而为一(报告)？
如何将多个查询合并为一个？例如: //Successful Sales: SELECT username, count(*) as TotalSales, sum(point) as Points
用于性能优化的 mysqltuner 报告
MySQL 优化技术的新手。请找到下面的 mysqltuner.pl 报告，并建议我应该更改 my.cnf 中的哪些变量以优化性能。还有一个问题- 我无法在我的 my.cnf 中找到一些变量，例如
java - 事件调度线程 - 报告
我想知道，我想将我的 Swing Worker 的某种形式的进度报告回主线程，以便我的界面可以使用随着进度增加而变化的标签进行更新，例如 checking 1/6... checking 2/6...
Magento Paypal 报告
我正在尝试在“报告”>“销售”下运行 Magento Paypal 结算报告，但每次我尝试运行该报告时，我都会收到消息“由于配置为空，无法获取任何内容” 我查看了“系统”>“配置”>“销售”>“付款方
MySQL 报告 - 编辑器
我想要一个工具来帮助创建 sql 查询(对于非 IT 人员)，例如 dbforge。我希望我们的非 IT 人员(例如运营)创建他们自己的 sql 查询。我的第二个目标是让他们能够按需执行这些查询。

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

R 3.4.1 - RSiteCatalyst 排队报告智能使用 while 循环