- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设我有以下疑问:
d1 = service.data().ga().get(
ids='ga:xxxxxxx',
start_date='2016-04-25',
end_date='2016-05-14',
metrics='ga:users',
dimensions='ga:dimension1,ga:hour,ga:date',
sort='-ga:date',
start_index='1',
max_results='1500').execute()
d2 = service.data().ga().get(
ids='ga:xxxxxxx',
start_date='2016-04-25',
end_date='2016-05-14',
metrics='ga:uniqueEvents',
dimensions='ga:dimension1,ga:eventCategory,ga:eventAction,ga:eventLabel,ga:date,ga:hour',
sort='-ga:date',
start_index='1',
max_results='1500').execute()
ga:dimension1
正在填充每个用户唯一的用户范围的客户端 ID。
目标是加入d1
和d2
上ga:date
, ga:hour
,和ga:dimension1
.
但假设用户在 10 点开始 session ,并在 12 点触发事件。d1
会给出 hour = 10,但会 d2
给出小时 = 10 或 12?
最佳答案
事件将获取事件发生的小时,即 d2
在您的示例中将给出 hour=12。
解决这个问题的方法是在查询中添加维度 ga:sessionDurationBucket
,该维度以秒为单位给出 session 的持续时间(请参阅 here )。我不确定你使用什么语言来访问 api,无论如何我不会发布代码,而只会发布解决问题的步骤。 (我使用 R
,当然,如果您认为有帮助,我可以发布我的代码)。
我根据 ga:date
、ga:hour
和 ga:min
为每条记录构建时间戳
我按 ga:dimension1
和 ga:sessionDurationBucket
对记录进行分组
对于每个组,在循环中:(a) 获取较旧的时间戳,并添加 session 持续时间 (ga:sessionDurationBucket
/60+1)/(60* 24) 要获取“最后”时间戳,(b) 我将从 session 的第一个时间戳到最后一个时间戳的所有记录分配给 session ,并且 (c) 如果还有剩余记录,则新的第一个时间戳是旧时间戳这些剩余的记录,然后我转到 (a)
循环之后,“所有”寄存器都分配给一个 session ,然后我进行处理(我将所有寄存器放在引号之间,因为进程中可能有一些寄存器我无法分配,但通常数量可以忽略不计) )
我希望它足够清楚并且有帮助。如果您认为它有用,我可以发布 R
代码,或者如果您告诉我您使用哪种编程语言,我可以尝试重写它...
注释后添加:R 中的示例代码
我正在使用 RGoogleAnalytics
库,这是我运行的查询(请注意,在本例中我不使用 dimension1
,因为我正在使用的网站确实没有设置):
query.coll.d <- Init(start.date=start_date.d,
end.date=end_date.d,
dimensions=c("ga:date",
"ga:hour",
"ga:minute",
"ga:sourceMedium",
"ga:pagePath",
"ga:previousPagePath",
"ga:sessionDurationBucket"),
metrics=c("ga:sessions",
"ga:pageviews",
"ga:newUsers"),
table.id="ga:XXX view id XXX",
sort="-ga:date,-ga:hour,-ga:minute",
max.results = 20000)
ga.query.d <- QueryBuilder(query.coll.d)
ga.data.coll.d <- GetReportData(ga.query.d, token, paginate_query=TRUE)
据此,我构建了时间戳(请注意,GA 不提供秒),
require(chron)
ga.data.coll.d$datetime <- chron(ga.data.coll.d$date, paste(ga.data.coll.d$hour,
ga.data.coll.d$minute,
'00',
sep=":"),
format=c("ymd","h:m:s"))
这是一个使用全局变量创建唯一 userId 的函数,以便我稍后可以在函数中使用它。
userId <- 1
getNewId <- function() {
current <- get("userId", envir = .GlobalEnv)
current <- current + 1
assign("userId", current, envir = .GlobalEnv)
return(current)
}
这是我根据上面尝试描述的算法处理分组结果的函数,其中 sessionDurationBucket
是一个整数,datetimes
和sessions
是 session 列表和分组依据的时间戳。
one_minute <- 1/(60*24)
setUserId <- function(datetimes, sessions, sessionDurationBucket) {
if (length(datetimes) == 1) {
# just one row received
return(getNewId())
}
if (sum(sessions) == 1) {
# just one session, all rows belong to the same user
return(getNewId())
}
users <- rep(NA, length(datetimes))
if (sessionDurationBucket == 0) {
# sessions of 1 page and length 0 => assign a user per session
for (i in 1:length(datetimes)) {
users[i] <- getNewId()
}
return(users)
}
# general case
minutes <- ceiling(as.numeric(sessionDurationBucket)/60) + 1
i <- 1
while(TRUE) {
index_lag <- (datetimes >= datetimes[i] - minutes*one_minute) & is.na(users)
sessions_lag <- sum(sessions[index_lag])
if (sessions_lag == 1) {
users[index_lag] <- getNewId()
} else {
# two or more sessions mixed together
users[index_lag] <- 0
}
# look for remaining users (without id yet)
rem_users <- which(is.na(users))
if (length(rem_users) == 0) {
break
}
i <- min(rem_users)
}
return(users)
}
我使用 data.table
来运行分组并创建新列(请注意,在您的情况下,您可以使用 dimension1
而不是 sourceMedium
在分组依据中)。另请注意,它假设寄存器按日期逆序排列,这是在 GA 查询中完成的。
require(data.table)
ga.data.coll.dt <- data.table(ga.data.coll.d)
ga.data.coll.dt[, userId:=setUserId(datetime, sessions, sessionDurationBucket), by=list(sessionDurationBucket, sourceMedium)]
最后,我删除了所有 userId
等于 0 的寄存器,因为对于那些寄存器,上面的代码无法解析 session 。就我而言,这个数字可以忽略不计。
我实际上打算在我的简陋博客中写一篇文章,包括更多解释,但直到月底我才能做到......希望它有所帮助。
关于google-analytics - 谷歌分析 API : hour of event vs hour of session?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37228105/
当检测鼠标x和y坐标时,最好像这样使用event.clientX和event.clientY: function show_coords(event){ var x=event.clientX;
我有以下代码: document.oncontextmenu = function(evt) { evt = evt || window.event; console.log(evt.
对于另一个问题,我遇到了一个似乎偶尔出现在 SO 的误解。一些提问者似乎认为触发器之于数据库就像事件之于 OOP 一样。 有没有人有一个很好的类比来解释为什么这是一个有缺陷的比较,以及误用它的后果?
$('body').keypress(function(event){ if(event.keyCode == 46){console.log('Delete Key Pressed')};
我正在制作一个“流体”文本区域,它根据内容调整其高度。我实际上正在尝试实现 this脚本。我有以下代码:https://ellie-app.com/Vjtvm6yrKWa1/4 问题是,当增加高度时,
我使用 Raphael .mouseover() 和 .mouseout() 事件来突出显示 SVG 中的某些元素。这工作正常,但在我单击一个元素后,我希望它停止突出显示。 在 Raphael doc
我目前正在开发一个应用程序,允许人们为在线广播电台安排“节目”。 我希望用户能够设置重复事件,例如:- “躁狂星期一”节目 - 每周一 9 点至 11 点“月中疯狂” - 每个月的第二个星期四“本月新
我有以下三个表格(简化版本): 已加载关卡: id(整数、主键、自动增量) globalId(整数,键) 日期(日期时间、键) serverId(Int,键) gamemodeId(Int,Key)
在我阅读 Gevent Tutorial 之后,我有一个关于 gevent.event.Event 的问题。 Event.set() 是否会唤醒所有被 Event.wait() 阻塞的函数? 就像下面
我对 cakephp ver3.1.3 没有经验 我按照说明实现了登录认证功能; http://book.cakephp.org/3.0/en/tutorials-and-examples/blog-
现在,我发送 10 个事件,每个事件有 1 个属性。但是当我想过滤特定事件并按属性选择事件时,在“事件属性”过滤器中仅显示前 7 个事件,而我为其余事件添加的事件仅显示“第一次”过滤器,为什么? 最佳
我不知道我的 Firefox 发生了什么! 我的aspx和javascript代码是这样的: function a() { alert(
中有3个事件fns重装 ,我可以对两者做同样的事情 reg-event-db和 reg-event-fx . reg-event-db之间的主要区别是什么, reg-event-fx和 reg-eve
我遇到了 Firefox keydown 行为,因为在没有聚焦于特定字段的情况下按下 Enter 键(实际上是任何键)不会触发 keydown 事件只会触发`按键事件。 这可能会非常令人困惑,因为 k
这是我的代码片段 public class Notation : INotifyPropertyChanged { public event PropertyChangedEventHandl
我可以在一个 Jsf2 xhtml 文件中有多个标签吗? 在那种情况下,关联的监听器将以什么顺序被调用? Mojarra 2.1.1/Apache Tomcat 7.0.22/PrimeFaces 3
我可以在一个 Jsf2 xhtml 文件中有多个标签吗? 在那种情况下,关联的监听器将以什么顺序被调用? Mojarra 2.1.1/Apache Tomcat 7.0.22/PrimeFaces 3
我有以下 JavaScript: $('#ge-display').click(function (event) { window.open('/googleearth/ge-display.ph
我需要确定触发事件的元素。 使用 event.target 获取相应的元素。 我可以从那里使用哪些属性? 引用 编号 节点名 我找不到关于它的大量信息,即使在 jQuery 上也是如此页,所以希望有人
我在pyGame中创建了一个Asteroidz克隆,并在pygame.vent.get()循环中有两个for Event,一个用于检查退出请求,以及游戏是否应该通过按空格键开始,然后在游戏中进一步尝试
我是一名优秀的程序员,十分优秀!