- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 data.table 为机器学习问题创建约 1000 个特征。我有两个通过 id 链接的表。第一个表每行都有一个唯一的 id,我们称之为 x。第二个表对于每个 id x 都有多行。此外,我还有其他三列是因子类型变量。我还有一些需要使用的其他数字列。我的目标是计算按 x 和其他因子变量分组的每个数值变量的最小值、最大值和平均值,然后通过为因子列的每个组合创建一列来 reshape 信息,以便每行只有一个唯一的 x id与关联的计算数字列。由于我有许多数字列,因此我也希望无需对列进行硬编码且无需循环即可执行此操作,因为有许多数字列。
作为示例,我可以在基本结构中创建一个 data.table:
set.seed(1234)
DT <- data.table(x=rep(c(1,2,3),each=8),
y1=c("A","B"), y2=c("C","D", "E"),y3=c("F","G"), v1=sample(1:100,12),
v2=sample(1:100,12), v3=sample(1:100,12))
DT
x y1 y2 y3 v1 v2 v3
1: 1 A C F 12 29 22
2: 1 B D G 62 92 81
3: 1 A E F 60 100 52
4: 1 B C G 61 82 89
5: 1 A D F 83 28 80
6: 1 B E G 97 26 5
7: 1 A C F 1 18 43
8: 1 B D G 22 22 25
9: 2 A E F 99 30 29
10: 2 B C G 47 96 47
11: 2 A D F 63 15 17
12: 2 B E G 49 4 68
13: 2 A C F 12 29 22
14: 2 B D G 62 92 81
15: 2 A E F 60 100 52
16: 2 B C G 61 82 89
17: 3 A D F 83 28 80
18: 3 B E G 97 26 5
19: 3 A C F 1 18 43
20: 3 B D G 22 22 25
21: 3 A E F 99 30 29
22: 3 B C G 47 96 47
23: 3 A D F 63 15 17
24: 3 B E G 49 4 68
x y1 y2 y3 v1 v2 v3
然后使用以下方法创建示例分组:
interim <- DT[,list(v1min=min(v1),
v1max=max(v1),
v1mean=mean(v1),
v2min=min(v2),
v2max=max(v2),
v2mean=mean(v2),
v3min=min(v3),
v3max=max(v3),
v3mean=mean(v3)),
by=.(x,y1,y2,y3)]
interim
x y1 y2 y3 v1min v1max v1mean v2min v2max v2mean v3min v3max v3mean
1: 1 A C F 1 12 6.5 18 29 23.5 22 43 32.5
2: 1 B D G 22 62 42.0 22 92 57.0 25 81 53.0
3: 1 A E F 60 60 60.0 100 100 100.0 52 52 52.0
4: 1 B C G 61 61 61.0 82 82 82.0 89 89 89.0
5: 1 A D F 83 83 83.0 28 28 28.0 80 80 80.0
6: 1 B E G 97 97 97.0 26 26 26.0 5 5 5.0
7: 2 A E F 60 99 79.5 30 100 65.0 29 52 40.5
8: 2 B C G 47 61 54.0 82 96 89.0 47 89 68.0
9: 2 A D F 63 63 63.0 15 15 15.0 17 17 17.0
10: 2 B E G 49 49 49.0 4 4 4.0 68 68 68.0
11: 2 A C F 12 12 12.0 29 29 29.0 22 22 22.0
12: 2 B D G 62 62 62.0 92 92 92.0 81 81 81.0
13: 3 A D F 63 83 73.0 15 28 21.5 17 80 48.5
14: 3 B E G 49 97 73.0 4 26 15.0 5 68 36.5
15: 3 A C F 1 1 1.0 18 18 18.0 43 43 43.0
16: 3 B D G 22 22 22.0 22 22 22.0 25 25 25.0
17: 3 A E F 99 99 99.0 30 30 30.0 29 29 29.0
18: 3 B C G 47 47 47.0 96 96 96.0 47 47 47.0
理想的输出将只有 3 行 - 每个唯一的 x (1,2,3) 一行,并带有以下列(预计会有一些 NA):
x | A-C-F-v1min | A-C-F-v1max | A-C-F-v1mean | . . . | B-C-G-v3min | B-C-G-v3max | B-C-G-v3mean
最佳答案
这样就可以了:
dcast(interim, x~y1+y2+y3, value.var = setdiff(names(interim), c('x', 'y1', 'y2', 'y3')))
我不记得 1.9.6 中是否存在多个 value.var
,因此您可能需要获取最新的 development version .
关于r - 通过创建附加列将 R data.table 从 4 个 id 列转换为 1 个 id 列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37057593/
只是想知道这些结构之间有什么区别(text、data、rodata、bss 等)在链接描述文件中: .data : { *(.data) } .data : { *(.data*) }
Data 定义为其核心功能之一 gfoldl : gfoldl :: (Data a) => (forall d b. Data d => c (d -> b) -> d -> c b)
以下之间有什么区别:data-sly-use、data-sly-resource、data-sly-include 和 数据-sly-模板?我正在阅读 Sightly AEM 上的文档,我非常困惑。
我有一个 Spring Boot、Spring Data JPA (hibernate) Web 应用程序,并且想引入文本搜索功能。 我理解以下内容 hibernate search 或 spring
我不知道我的代码有什么问题。我读了其他有同样问题的人的一些问题,但没有找到答案。当我尝试编译时出现以下错误: ||In function 'main':| |35|error: expected ex
我不太确定为什么会收到此错误或其含义。我的数据框称为“数据”。 library(dplyr) data %>% filter(Info==1, Male==1) %>% lm(CFL_
我一直在 GitHub 等更现代的网站上看到这些属性,它们似乎总是与自定义的弹出窗口一致,如 title 属性。 Option 1 Option 2 Option 3 Option 4 我在 HTML
如何用 iCloud Core Data 替换我现有的 Core Data?这是我的持久商店协调员: lazy var persistentStoreCoordinator: NSPersistent
我一直在 GitHub 等更现代的网站上看到这些属性,它们似乎总是与自定义的弹出窗口一致,如 title 属性。 Option 1 Option 2 Option 3 Option 4 我在 HTML
我正在通过 this project 在 Android 上摆弄 node.js ,我需要一种方法将 js 文件部署到私有(private)目录(以隐藏源代码,防止用户篡改),该目录也物理存在于文件系
大家好我有点沮丧,所以我希望得到一些帮助。我的项目在 SwiftUI 中。我想使用图像选择器将图像保存到 Core Data。我实现了让 ImagePicker 工作,但我正在努力转换 Image -
我有以下数据和代码: mydf grp categ condition value 1 A X P 2 2 B X P 5
我一直在努力解决这个问题,但我根本找不到任何解决问题的方法。希望这里有人可以提供帮助。 我正在尝试为具有以下结构的某些数据创建个人选择矩阵: # A tibble: 2,152 x 32 a
我了解 Data.Map.Lazy 和 Data.Map.Strict 是不同的。但是,当您导入 Data.Map 时,您究竟导入了什么:严格的、惰性的还是两者的组合? 最佳答案 懒人。看着docs
我正在开发一个 C 程序,用于从 BerkeleyDB DBTree 数据库中提取数据值与特定模式匹配的记录。我创建数据库,打开它,将键的 DBT 和数据的另一个 DBT 清零,将 DBT 标志设置为
所以我有以下成员(member)历史表 User_ID | Start date | End Date | Type(0-7) | ---------------------------
随着最近推出的包dataframe ,我认为是时候正确地对各种数据结构进行基准测试,并突出每种数据结构的优势。我不是每个人的不同优势的专家,所以我的问题是,我们应该如何对它们进行基准测试。 我尝试过的
我有来自 API 的数据,但无法将数组中的数据设置为 vue.js 中的 this.data这是来自 API 的数据(JSON) 你能告诉我这个语法吗 {"id":1613, "name_org":"
在 Vue.js到目前为止,我已经找到了两种定义数据的方法:data: {} 和 data() { return; }. data: { defaultLayout: 'default' }
我正在研究Spring Data Rest Services,并在自定义拦截器中遇到一些问题。之前我使用spring-data-rest-webmvc 2.2.0并以以下方式添加了拦截器。 publi
我是一名优秀的程序员,十分优秀!