- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
DAU 和 MAU(日活跃用户和月活跃用户)是衡量用户参与度的既定方法。
如何使用 SQL 和 Google BigQuery 获取这些数字?
最佳答案
2019 标准 SQL 更新:
(要了解 DAU/MAU 的实用性,请参阅 http://blog.compariscope.wefi.com/mobile-app-usage-dau-mau 等文章)
让我们来研究一下存储在 BigQuery 中的 reddit 评论数据。我们想在每日滚动的基础上找出“AskReddit”subreddit 的 dau/mau 比率:
SELECT day, dau, mau, INTEGER(100*dau/mau) daumau
FROM (
SELECT day, EXACT_COUNT_DISTINCT(author) dau, FIRST(mau) mau
FROM (
SELECT DATE(SEC_TO_TIMESTAMP(created_utc)) day, author
FROM [fh-bigquery:reddit_comments.2015_09]
WHERE subreddit='AskReddit') a
JOIN (
SELECT stopday, EXACT_COUNT_DISTINCT(author) mau
FROM (SELECT created_utc, subreddit, author FROM [fh-bigquery:reddit_comments.2015_09], [fh-bigquery:reddit_comments.2015_08]) a
CROSS JOIN (
SELECT DATE(SEC_TO_TIMESTAMP(created_utc)) stopday
FROM [fh-bigquery:reddit_comments.2015_09]
GROUP BY 1
) b
WHERE subreddit='AskReddit'
AND SEC_TO_TIMESTAMP(created_utc) BETWEEN DATE_ADD(stopday, -30, 'day') AND TIMESTAMP(stopday)
GROUP BY 1
) b
ON a.day=b.stopday
GROUP BY 1
)
ORDER BY 1
此查询获取 9 月每一天的 DAU,并查看 8 月的数据以获取在每个 DAU 日结束的每个 30 天期间的 MAU。这需要大量处理(30 倍),如果我们只计算 9 月的一个 MAU 并继续使用该值作为分母,我们可以获得几乎相同的结果:
SELECT day, dau, mau, INTEGER(100*dau/mau) daumau
FROM (
SELECT DATE(SEC_TO_TIMESTAMP(created_utc)) day, EXACT_COUNT_DISTINCT(author) dau, FIRST(mau) mau
FROM [fh-bigquery:reddit_comments.2015_09] a
CROSS JOIN (
SELECT EXACT_COUNT_DISTINCT(author) mau
FROM [fh-bigquery:reddit_comments.2015_09]
WHERE subreddit='AskReddit'
) b
WHERE subreddit='AskReddit'
GROUP BY 1
)
ORDER BY 1
这是一个更简单的查询,可以更快地为我们带来几乎相同的结果。
现在获取该 subreddit 在本月的平均值:
SELECT ROUND(100*AVG(dau/mau), 2) daumau
FROM (
SELECT DATE(SEC_TO_TIMESTAMP(created_utc)) day, EXACT_COUNT_DISTINCT(author) dau, FIRST(mau) mau
FROM [fh-bigquery:reddit_comments.2015_09] a
CROSS JOIN (
SELECT EXACT_COUNT_DISTINCT(author) mau
FROM [fh-bigquery:reddit_comments.2015_09]
WHERE subreddit='AskReddit'
) b
WHERE subreddit='AskReddit'
GROUP BY 1
)
这告诉我们“AskReddit”在 9 月份的参与度为 8.95%。
最后一站,如何比较不同 subreddits 中的参与度:
SELECT ROUND(100*AVG(dau)/MAX(mau), 2) avg_daumau, MAX(mau) mau, subreddit
FROM (
SELECT a.subreddit, DATE(SEC_TO_TIMESTAMP(created_utc)) day,
EXACT_COUNT_DISTINCT(author) dau, FIRST(mau) mau
FROM [fh-bigquery:reddit_comments.2015_09] a
JOIN (
SELECT EXACT_COUNT_DISTINCT(author) mau, subreddit
FROM [fh-bigquery:reddit_comments.2015_09]
GROUP BY 2
) b
ON a.subreddit=b.subreddit
WHERE mau>50000
GROUP BY 1, 2
)
GROUP BY subreddit
ORDER BY 1
关于google-bigquery - 如何使用 BigQuery(参与度)计算 DAU/MAU,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33226570/
最近我有兴趣加入一个开源的 p2p 文件共享项目。我对这个主题的了解不是那么具体,我的意思是我了解安全、网络、p2p 基础知识,但我仍然不知道从哪里开始同时了解全局和实际细节。简而言之,推荐的资源是什
自从百度发布超链接算法升级公告之后,看到很多SEO大神对于外链对排名的作用就更加讳莫如深,而作为个人站长,大家对于外链的看法各执一词。像高质量外链、外链作用、外链对排名的影响等等话题,各大论坛讨论的
老实说,这是一个家庭作业问题,但我已经浪费了好几个小时,而且无法正确解决。它返回错误数量的结果或错误的数据: 我需要选择参与指导电影和/或在电影中表演的每个人以及他们所做的次数,如果至少 5 次。 有
我只是想知道如何为我的应用程序激活 (RED) 东西。我在我的应用程序中添加了一个新的更新,看看是否有参与的复选标记,但没有。是否可能是 Apple 决定哪些应用“有资格”加入该计划? 提前致谢:)
在我的代码中我有这样的东西: struct SomeStruct { int test1; int test2; float test3; float test4; }; std::v
我有一个继承自 UIControl 的自定义类,用于获取触摸事件。它基本上是其他控件的集合,这些控件充当一个整体。我正在将我的应用程序从 xibs 转换为 Storyboard。除了这个之外,它基本上
我正在使用 expo 制作一个 React 应用程序,我想允许子元素出现在我的 TopicSection 元素中。我关注了this guide为了允许 JSX 元素中的子元素,并编写了以下代码。我尝试
根据 Uber 文档,应通过以下方式推荐新用户:“https://m.uber.com/sign-up?client_id=YOUR_CLIENT_ID ” 那么,有没有办法通过以下方式引用使用 oA
更新:这个问题至少通过 -XX:+UseCountedLoopSafepoints 和等于或高于 JDK 1.8.0_92 的 JVM 版本(使用 _161 测试)的组合粗略地解决了。 原创:包含 J
我有一个 Maven 项目,它编译为 webapp,具有标准 Maven war 布局。我正在尝试向同一个项目添加方面,但当部署为 Tomcat 上的 war 时,这些方面不会被触发。如果我将项目部署
现在 Facebook 会列出生日等事件的参与度,我想在我的网站上显示参与度。 有什么方法可以通过图形 API 让 friend 参与进来吗? 最佳答案 https://graph.facebook.
我正在安装 Engage! 我按照此处的安装说明进行操作:http://engagecsm.com/readme 我做的安装步骤: 添加互动!到应用程序的 Gemfile:gem 'engagecsm
对于以下实体关系结构,我正在努力弄清楚 LOAN 和 ITEM 实体之间的关系是否有效? LOAN 的弱实体使用 'loan_dateLeant' 的部分键和来自 CUSTOMER 和 ITEM 的主
我目前正在研究涉及 VBA 和 IE 的自动化流程。随着我的代码正在执行的多项操作,一切都与时俱进。问题是当我接近一个有 2 个下拉列表的部分时,在第一个下拉列表中做出某些选择后出现第二个下拉列表。
我有以下 Spring Integration 配置。我在这里所做的是dequeuing 来自主题的消息并在转换后将其发送到某个 HTTP 位置。 JMS 连接工厂 配置如下:
我正在使用 python-firebase在我的堆栈中记录点击次数和其他事件数据。它工作正常,但时不时地抛出这个堆栈跟踪: 'ConnectionError(MaxRetryError("HTTPSC
我是一名优秀的程序员,十分优秀!