- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在处理一个数据集,该数据集具有我以前从未使用过的结构。它具有这种格式(最后输入数据的代码):
df
#> Instance Alice_prefers Bob_prefers Charlie_prefers
#> 1 1 Bob Charlie Alice
#> 2 2 Bob Alice Bob
#> 3 3 Bob Charlie Bob
我正在尝试创建一个变量来显示两个人何时“匹配”,即当他们都喜欢对方时,例如,如果 Alice 更喜欢 Bob,而 Bob 也更喜欢 Alice——这是相互匹配:Alice 和 Bob 匹配.
所以我想要的输出是:
output
#> Instance Alice_prefers Bob_prefers Charlie_prefers Match
#> 1 1 Bob Charlie Alice <NA>
#> 2 2 Bob Alice Bob AliceBob
#> 3 3 Bob Charlie Bob BobCharlie
使用 case_when()
似乎可以解决问题,但是有没有比列出每个案例更简单的方法,就像我在下面开始做的那样?在我的真实数据集中,我希望有更多的人,而不仅仅是 Alice、Bob 和 Charlie。
第二个问题:
当我有更多人时,例如。 Alice、Bob、Charlie 和 Denise,Match
列可能包含多个匹配项(例如,Alice 和 Bob 匹配,以及 Charlie 和 Denise 匹配)——对此的整洁解决方案是什么?我是否应该为每个可能的匹配项(例如 AliceBob、AliceCharlie 等)设置一个取值为 1 或 0 的指示变量?
我这样做的原因是:我希望能够快速查看比赛的数量以及比赛中有谁。
#df <- df %>% mutate(Match = ifelse(Alice_prefers=="Bob" & Bob_prefers =="Alice", "AliceBob", NA))
df <- df %>% mutate(
Match = case_when(
(Alice_prefers=="Bob" & Bob_prefers=="Alice") ~ "AliceBob",
(Charlie_prefers=="Bob" & Bob_prefers=="Charlie") ~ "BobCharlie"
)
)
df
数据输入代码:
df <- data.frame(stringsAsFactors=FALSE,
Instance = c(1, 2, 3),
Alice_prefers = c("Bob", "Bob", "Bob"),
Bob_prefers = c("Charlie", "Alice", "Charlie"),
Charlie_prefers = c("Alice", "Bob", "Bob")
)
最佳答案
您遇到图形问题,这通常意味着您应该使用 igraph。您正在寻找有向图中的互边。
我使用 data.table 进行分组,但如果您愿意,也可以使用 tidyverse。
首先,您应该将数据 reshape 为整洁(长)格式。这也是整洁的输出格式。
names(df) <- gsub("_prefers", "", names(df), fixed = TRUE)
library(reshape2)
mdf <- melt(df, id.vars = "Instance")
# Instance variable value
#1 1 Alice Bob
#2 2 Alice Bob
#3 3 Alice Bob
#4 1 Bob Charlie
#5 2 Bob Alice
#6 3 Bob Charlie
#7 1 Charlie Alice
#8 2 Charlie Bob
#9 3 Charlie Bob
library(data.table)
setDT(mdf) #for group-by
library(igraph)
mdf[, Match := {
#turn subsets into graphs
g <- graph_from_data_frame(.SD[, .(variable, value)])
#initialize result
res <- character(.N)
#find reciproc pairs
m <- which_mutual(g)
#I'd probably just return m
#but just for fun,
#get names of reciproc pairs
res[m] <- attr(E(g)[m], "vnames")
res
}, by = Instance]
# Instance variable value Match
#1: 1 Alice Bob
#2: 2 Alice Bob Alice|Bob
#3: 3 Alice Bob
#4: 1 Bob Charlie
#5: 2 Bob Alice Bob|Alice
#6: 3 Bob Charlie Bob|Charlie
#7: 1 Charlie Alice
#8: 2 Charlie Bob
#9: 3 Charlie Bob Charlie|Bob
如果你只想要计数,那就更简单了:
mdf[, .(count = {
#turn subsets into graphs
g <- graph_from_data_frame(.SD[, .(variable, value)])
reciprocity(g) * .N
}), by = Instance]
# Instance count
#1: 1 0
#2: 2 2
#3: 3 2
关于r - 不寻常的(对我来说)数据结构 : count how often two columns mutually point to one another,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58426197/
这正确地呈现了标题,因为我可以看到一个列带有“Product ID”标题的表:。我正试图重构它,这样我就可以重用它,因为它们在整个应用程序中几乎是相同的:。在这种情况下,头不会呈现...检查页面元素中
我什至不知道如何表达这一点,但在 Python 中有没有一种方法可以引用等号之前的文本,而无需实际再次编写? ** 编辑 - 我在 Jupyter 中使用 python3 我似乎用了半辈子的时间来写作
假设我有一个包含以下列的字典 dict_ = [ {'key1': 'value1', 'key2': 'value2', 'key3': 'value3', '
假设我有一个包含以下列的字典 dict_ = [ {'key1': 'value1', 'key2': 'value2', 'key3': 'value3', '
假设我的数据库中有一张地铁 map ,其中每条线路的每个站点都是一行。如果我想知道我的线路在哪里互连: mysql> SELECT LineA.stop_id FROM LineA, LineB WH
代码 select c1,c2,c3,c4,c5,c6 from table where c5 in ('a', 'b') 从这里开始,我想将 c5 列拆分为两列,然后根据它们对 c
我正在尝试搜索表格中的两列,即标题和描述。但我想先搜索标题,然后再搜索描述。所以匹配标题的所有行排在第一位,所有匹配描述的行排在第二位 我可以使用单个 SQL 查询来实现吗? 最佳答案 您还可以使用
下面有以下 Python 数据框。 “标志”字段是我想要用代码创建的所需列。 我想要执行以下操作: 如果“分配类型”是预测的并且“Activities_Counter”大于 10,我想创建一个名为“F
我有两列,area 和 block,其中 area 是一个 int 类型,block 是一个 varchar。 现在我正在写两个查询: select * from table where area a
使用 Slick 2,我试图生成一个带有元组 IN 子句的查询: select * from my_table where (a, b) IN ((1, 87)); 给定: val seq: Seq[
我正在尝试从数据透视表中获取一组值,其中 A 列等于值数组,例如 ID 12 的 attribute_value_id 等于 3 和 9。这可以做到吗?我已经走了这么远... ID | post_id
我找不到这样做的有效方法。我在 Python 中有以下 DataFrame,列从 A 到 Z A B C ... Z 0 2.0 8.0 1.0 ... 5.0 1
我的数据框中有以下格式的数据: >>> df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) >>> df
我有多个与我公司销售的产品相关的表被新产品取代,随着时间的推移,这导致了多个表的出现。 我一遍又一遍地使用以下查询,直到最终表中只剩下 2 个产品... CREATE TABLE mar15a
我有如下 2 个表:- 表A ------------------------------- | product_id | price | --------------------
我有一个名为 tbl_mainsheet7 的表,创建方式如下: pk_mainsheet client_id project_id mainsheet_id project_cat EA_
我得到了以下 HTML 结构: ... ... 我的 CSS: #main-container { width:80%; margin:20px auto;
对于我的以下要求,我无法获得解决方案。 如果 data.table(如下)在 Col1 和 Col3 中有匹配的值。替换 Col2 值(旧的 New-Val)。 Col1 Col2 Col3
我正在通过连接几个表来构建一个 View ,以通过 Entity Framework 提取数据。由于此 View 没有唯一列,EntityFramework 无法检索正确的结果集(即第一列重复)。 为
好的,我已经尝试了太久了,是时候寻求帮助了。我有一个看起来有点像这样的数据框: person fruit quantity all_fruits 0 p1 grapes 2
我是一名优秀的程序员,十分优秀!