r - 表格 : How can I measure similarity of sets of dimensions across dates?-6ren

r - 表格 : How can I measure similarity of sets of dimensions across dates?

转载作者：行者123 更新时间：2023-12-04 00:53:02

25

4

这有点复杂 - 但我会尽力解释。我有一个数据集，其中包含我每天从特定视频点播界面抓取的数据。每天都会显示大约 120 个标题(12 x 10 的网格)- 数据包括一系列变量:抓取日期、节目标题、节目的垂直/水平位置、类型、概要等。

我想做的一件事是分析日常提供的内容的相似性。我的意思是我想比较给定日期有多少标题出现在前一天(理想情况下以百分比表示)。因此，如果 40 个(共 120 个)标题与前一天相同，则相似度为 30%。

事情是这样的——我知道如何做到这一点(感谢这个网站上的一些好心的陌生人帮助我使用 R 编写了一个脚本)。您可以在此处查看提供更多详细信息的帖子:Calculate similarity within a dataframe across specific rows (R)

但是，此方法会根据每天的标题总数创建相似度分数，而我还希望能够在应用其他过滤器后探索相似度。具体来说，我想将焦点缩小到出现在前四行和前四列中的标题。换句话说:这些职位中有多少与前一天相同？我可以通过修改 R 脚本来完成此操作，但似乎更好的方法是在 Tableau 中执行此操作，这样我就可以“实时”更改这些参数，可以这么说。 IE。如果我想关注前 6 行和前 6 列，我不想重新运行 R 脚本并更新基础数据!

感觉好像我在这里遗漏了一些非常明显的东西——也许这是一个简单的表计算？或者我需要以某种方式告诉 Tableau 如何对数据进行子集化？

希望这一切都是有道理的，但如果没有，我很乐意澄清。另外，我无法为您提供基础数据(出于研究原因!)，但如果有帮助，我可以提供示例。

提前致谢:)

最佳答案

您可以两全其美。使用 Tableau 连接到您的数据，根据需要进行过滤，然后让 Tableau 调用 R 脚本来计算相似度并将结果返回到 Tableau 以供显示。

如果这符合您的用例，您需要学习将其付诸实践的机制。在 Tableau 方面，您将使用以单词 SCRIPT 开头的函数来调用您的 R 代码，例如 SCRIPT_REAL() 或 SCRIPT_INT() 等。这些是表计算，因此您需要了解如何使用表计算工作，特别是在分区和寻址方面。这在 Tableau 帮助中进行了描述。您还必须通过在“帮助”->“设置和性能”菜单下管理外部服务，将 Tableau 指向您的 R 代码的主机。

在 R 端，您当然需要编写函数，然后使用函数 RServe() 使其可供 Tableau 访问。 Tableau 将参数向量发送到 R 并期望一个向量作为响应。上面提到的分区和寻址控制了这些向量的大小和顺序。

让机制发挥作用可能有点棘手，但它们确实有效。先练习一些简单的东西。

有关详细信息，请参阅 Tableau 的网站资源。此功能的正式名称是 Tableau“分析扩展”

关于r - 表格 : How can I measure similarity of sets of dimensions across dates?，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64936521/

25

4

0

文章推荐： Python - 列表理解问题 : do i need nested List Comprehension?

文章推荐： unicode - 如何在 Zig 中打印 UTF-16 字符串？

文章推荐： maven-2 - child 完成后在 parent 身上执行目标

文章推荐： F# - 联合案例名称中的句点

How to measure connectivity using Tarjan's algorithm in Apache Age to measure connectivity(如何在阿帕奇时代使用塔詹算法来测量连通性)
我一直在尝试实现塔詹的算法来测量图中的强连通分量。既然我还没有找到任何东西，谁能提供指导，说明如何在阿帕奇时代实现塔詹的算法来测量节点之间的连通性？以下是用python编写的代码。如何使用Apache
Android:在模块 jetified-play-services-measurement 和 jetified-play-services-measurement-impl 中发现重复类
我正在尝试更新我的一个 Android 项目的依赖项，但我收到了这个奇怪的错误。罪魁祸首是这一行，对于 AdMob(我之前使用的是 20.6.0): implementation "com.goog
windows - 为什么 'Measure-Object -InputObject $foo' 与 PowerShell 中的 '$foo | Measure-Object' 不同？
我在一个目录中有六个 .txt 文件。因此，我创建了一个变量: $foo = gci -Name *.txt $foo 现在是一个包含六个字符串的数组。就我而言，我有 PS > $foo Extens
android - 在模块 classes.jar com.google.android.gms :play-services-measurement-impl: 中发现重复的类 com.google.android.gms.internal.measurement.zzdu
可能已经在其他一些上下文和依赖项中询问了这个问题。但即使花了一整天，我仍然无法弄清楚这一点。所以下面我将完整的错误日志与我的项目级 Gradle 文件和应用级 Gradle 文件一起粘贴。尝试运
units-of-measurement - 数据库中测量单位的数据类型
对于我的应用程序，我需要保留用户首选的度量单位。目前可能的单位是: 升(存储我数据库其余部分的值的单位) 千克(随产品密度变化) 美国液体加仑(3.785411784 升) 美国液体夸脱(以上的 1
wpf - "Measure"的性能问题
我的应用程序遇到性能问题。本质上，我单击一个按钮，列表中填充了数据绑定(bind)数据(由于数据量大，这是虚拟化的)，然后单击另一个按钮，该按钮将向关联的 ListView 添加一行。我含糊其词是因为
Android:如何正确使用Path和Path Measure
我需要将一个 Path 对象与另一个进行比较。首先，我在 onTouchEvent 的一个路径中收集所有绘制的对象: switch (event.getAction()) {
swift - measure() 测试通常如何用于性能单元测试？
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 5 年前。 Improve
Swift Measurement class·角度转换精度
swift 4.2 Xcode 10β2 背景我正在整合一个与天文学相关的 API 来处理我正在开发的应用程序中的数学运算。目的是使用 Measurement 类来处理角度和距离的输入和输出。通过这
Android进阶之深入理解View的测量(Measure)流程机制
前言 View 的工作原理中最重要的就是测量、布局、绘制三大过程，而其中测量是最复杂的; 那么我们就来介绍下View 的测量过程; 1、MeasureSpec 测量自身的大小的时候，会
units-of-measurement - getBoundingClientRect 返回的单位是什么？
我知道 getBoundingClientRect() 返回类型为 ClientRect 或 DOMRect 的对象，并且每个对象通常都具有 x、y、width、height 等。如果您 typeof
powershell - Measure-Command 报告的时间不准确？
我有一个脚本来测量执行时间，但是当我使用 Measure-Command 时，我收到了似乎不准确的信息。例如，我自己为脚本计时，大约需要 15 秒才能完成。然而，这里是最后两个输出。如您所见，一个为负
react-native - .measure 不是函数
我想从屏幕顶部确定元素的位置。从其他问题来看，一种方法是使用 react native 的 .measure 属性？引用问题:React Native: Getting the position o
php - Measurement Protocol 位置错误
我编写了以下类来通过 GoogleAnalytics 测量我的服务器端流量测量协议(protocol)。问题是所有活跃的访问者都来自我的服务器当前所在的意大利 - 我假设问题原因来自 fsockop
java - 口水融合 : measure performance
我想根据规则的数量和规则的复杂性来衡量流口水的表现。因此，我需要测量处理事件所需的时间。我想编写一个像这样的简单测试: long start = System.currentTimeMillis();
python - skimage.measure 产生异常高的均方误差
考虑以下代码 import numpy as np from skimage import measure def mse(x, y): return np.mean(np.square(x
c# - 统一: What is Unity Measurements?
什么是统一坐标测量？ (厘米、米、公里) 如何在其中实现实实在在的措施？我想在 Unity 中实现一个真正的措施。怎么做？ public Vector2 GetAsMeters (Vector2 v
python - 如何计算召回率、精度和f-measure？
我正在从事一个情感分析项目，而且我是 Python 初学者。我需要计算召回率、精度和 f 度量，但我不知道数据集的语法，如下所示: #The train data format ,contains t
Javax.measure.quantity.Duration转换问题
我正在使用 javax.measure 将用户输入转换为秒，秒数可以从秒到天不等，但是从任何单位转换为另一个单位不起作用，这是我设置的。 String units = "d"; double valu
安卓 : Network info measurement
我正在尝试开发 android 应用程序以获取有关网络信息测量的低级信息。我想知道如何获取这些数据？ 3G:-RSCP-ECNO(不是 Eclo)-BER 2G:-RxLevelQuality-Rx

首页

博学

6Ren·AI

商城

r - 表格 : How can I measure similarity of sets of dimensions across dates?