r - 将多列组合成整洁的数据-6ren

r - 将多列组合成整洁的数据

转载作者：行者123 更新时间：2023-12-04 16:24:18

24

4

这个问题在这里已经有了答案:

Reshaping multiple sets of measurement columns (wide format) into single columns (long format)

(7 个回答)

4年前关闭。

我的数据集如下所示:

unique.id abx.1    start.1     stop.1 abx.2    start.2     stop.2 abx.3    start.3     stop.3 abx.4    start.4
1         1  Moxi 2014-01-01 2014-01-07  PenG 2014-01-01 2014-01-07 Vanco 2014-01-01 2014-01-07  Moxi 2014-01-01
2         2  Moxi 2014-01-01 2014-01-02 Cipro 2014-01-01 2014-01-02  PenG 2014-01-01 2014-01-02 Vanco 2014-01-01
3         3 Cipro 2014-01-01 2014-01-05 Vanco 2014-01-01 2014-01-05 Cipro 2014-01-01 2014-01-05 Vanco 2014-01-01
4         4 Vanco 2014-01-02 2014-01-03 Cipro 2014-01-02 2014-01-03 Cipro 2014-01-02 2014-01-03  PenG 2014-01-02
5         5 Vanco 2014-01-01 2014-01-02  PenG 2014-01-01 2014-01-02  PenG 2014-01-01 2014-01-02 Cipro 2014-01-01
      stop.4    intervention
1 2014-01-07       0
2 2014-01-02       0
3 2014-01-05       1
4 2014-01-03       1
5 2014-01-02       0

用一些代码来创建这个:

 abxoptions <- c("Cipro", "Moxi", "PenG", "Vanco")
      df3 <- data.frame(
      unique.id = 1:5,
      abx.1 = sample(abxoptions,5, replace=TRUE),
      start.1 = as.Date(c('2014-01-01', '2014-01-01', '2014-01-01', '2014-01-02', '2014-01-01')),
      stop.1  = as.Date(c('2014-01-07', '2014-01-02', '2014-01-05', '2014-01-03', '2014-01-02')),
      abx.2 = sample(abxoptions,5, replace=TRUE),         
      start.2 = as.Date(c('2014-01-01', '2014-01-01', '2014-01-01', '2014-01-02', '2014-01-01')),
      stop.2  = as.Date(c('2014-01-07', '2014-01-02', '2014-01-05', '2014-01-03', '2014-01-02')),
      abx.3 = sample(abxoptions,5, replace=TRUE),         
      start.3 = as.Date(c('2014-01-01', '2014-01-01', '2014-01-01', '2014-01-02', '2014-01-01')),
      stop.3  = as.Date(c('2014-01-07', '2014-01-02', '2014-01-05', '2014-01-03', '2014-01-02')),
      abx.4 = sample(abxoptions,5, replace=TRUE),         
      start.4 = as.Date(c('2014-01-01', '2014-01-01', '2014-01-01', '2014-01-02', '2014-01-01')),
      stop.4  = as.Date(c('2014-01-07', '2014-01-02', '2014-01-05', '2014-01-03', '2014-01-02')),
      intervention = c(0,0,1,1,0)

)

我想整理这些数据看起来像这样:

unique.id    abx     start    stop           intervention
1            Moxi    2014-01-10 2014-01-07      0
1            Pen G   2014-01-01 2014-01-07      0
1            Vanco   2014-01-01 2014-01-07      0
1            Moxi    2014-01-01 2014-01-07      0  etc etc

以下解决方案没有让我到达我需要的地方:
Gather multiple sets of columns和
Combining multiple columns into one

我怀疑 Hadley 令人惊叹的 tidyr pakcage 是要走的路……只是想不通。任何帮助将不胜感激。

最佳答案

几乎所有的数据整理问题都可以通过三个步骤来解决:

收集所有非变量列

将“colname”列分成多个变量

重新传播数据

(通常您只需要其中的一两个，但我认为它们几乎总是按此顺序排列)。

对于您的数据:

唯一已经是变量的列是 unique.id

您需要将当前列名拆分为变量和数字

然后您需要将“变量”变量放回列

这看起来像:

library(tidyr)
library(dplyr)

df3 %>%
  gather(col, value, -unique.id, -intervention) %>%
  separate(col, c("variable", "number")) %>%
  spread(variable, value, convert = TRUE) %>%
  mutate(start = as.Date(start, "1970-01-01"), stop = as.Date(stop, "1970-01-01"))

你的情况有点复杂，因为你有两种类型的变量，所以你需要在最后恢复这些类型。

关于r - 将多列组合成整洁的数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28729506/

24

4

0

文章推荐： azure - 获取 Azure 表行数

文章推荐： javafx - 从 TextField JavaFX 中删除默认焦点

文章推荐： Scala:如何屏蔽字符串的前 N 个字符

pandas read_json 成 block 但仍然有内存错误
我正在尝试读取和处理一个大的 json 文件(~16G)，但即使我通过指定 chunksize=500 读取小块，它仍然有内存错误。我的代码: i=0 header = True for chunk
css - 成 Angular CSS 分隔符
请看下图... 我想通过 CSS 实现。我现在将此分隔符用作在我的容器内响应的图像 ( jpg )。问题是我似乎无法准确匹配颜色或使白色晶莹剔透。我认为 CSS 是解决这个问题的最佳方式。尺寸为
javascript - 与 Node 成 Angular
所以我正在尝试使用 AngularJS 和 Node.js。我正在尝试设置客户端路由，但遇到一些问题。编辑所以我改变了一些代码如下 https://github.com/scotch-io/sta
html - 元素周围的虚线边框，左边框的顶部倾斜/成 Angular
我想创建如下图所示的边框: 这段代码是我写的 Some Text p{ -webkit-transform: perspective(158px) rotateX(338deg); -webk
forms - Symfony2 选择形式 split 成 Twig
好的，所以我有一个包含 2 个选项的选择表 $builder->add('type', 'choice', array( 'label' => 'User type', 'choice
c# - 图像 split 成 9 block
我的代码: private void pictureBox1_MouseDown(object sender, MouseEventArgs e) { ngr.
c++ - 如何将某些东西 push_back 成 2D Vector
我正在尝试编写 Tic-Tac-Toe 游戏代码，但不知道如何在轮到我时push_back '+' 字符。因此，每当玩家输入例如“Oben 链接”时，这基本上意味着左上角，我希望游戏检查输入是否正确
c# - 如何正确解析 Dictionary 成
我正在研究 HtmlHelper.AnonymousObjectToHtmlAttributes。它适用于匿名对象: var test = new {@class = "aaa", placehol
.htaccess - mod_rewrite/category.htm 成/category
在 stackoverflow 上所有这些 mod 重写主题之后，我仍然没有找到我的问题的答案。我有一个顶级站点，基本上我想做的就是将 /index.php?method=in&cat=Half+Li
css - 成 Angular ，将 CSS 色带包裹在图像上
仅使用 CSS 可以实现此功能区吗？最佳答案 .box { width: 300px; height: 300px; background-color: #a0a0a0;
ruby-on-rails - Jbuilder 转 & 成\u0026
我有一个 jbuilder 模板，它用 json 表示我的一个模型，如下所示: json.(model, :id, :field1, :field2, :url) 如果我只是从控制台访问该字段，则 u
java - F 点与 X 成 90 度
昨天我问了一个问题 - Draw arrow according to path 在那个问题中，我解释说我想在 onTouchEvent 的方向上绘制一个箭头。我在评论中得到了答案，说我应该旋转 Ca
html - 一致的代码 html 内联和与 knitr 成 block
我希望段落中的代码与代码块中显示的代码一致。例如: The formula method for a linear model is lm(y~x, data = dat). For our da
android - WebView 成 fragment (android.support.v4)
我使用 ViewPager 获得了一个选项卡菜单。每个选项卡都包含来自 android.support.v4 包的 fragment (与旧 SDK 的兼容性)。其中一个 fragment 是 Web
c++ - 如何将 boost::serialize 成 sqlite::blob？
我正在从事一项需要多种程序能力的科学项目。在四处寻找可用的工具后，我决定使用 Boost 库，它为我提供了 C++ 标准库不提供的所需功能，例如日期/时间管理等。我的项目是一组命令行，用于处理来自旧
Win7 时代爆火工具「截图」成 Win10 可选组件，支持卸载
外媒 Windows Latest 报道，随着 Windows 10 的不断发展，某些功能会随着新功能的更新而被抛弃或成为可选项。早在 2018 年，微软就确认截图工具将消失，现代的 “截图和草图”
javascript - 如何在 Google map 中创建定向(成 Angular )标记？
我有标记的 Angular ，我只希望标记旋转到那个 Angular 。 marker = new google.maps.Marker({ position: myL
javascript - 影响 ("bleeding"的外部 CSS 成)shadow DOM with Polymer
我一定是遗漏了什么，但我不知道是什么。我有使用 polymer 实现的简单自定义元素: TECK ..
java - 将 Java、XML、JavaScript 等 pretty-print 成 HTML
我有一个关于如何设置我们产品的分步教程。我必须在每个步骤中显示大量示例代码。以下是我必须在页面中显示的代码类型列表。我用什么来格式化所有内容？ Java 代码示例 XML 样本 iOS SDK 文件(
objective-c - 使用 LLVM GCC 4.2 不会让我将 CFStringRef _bridge 成 NSString
我需要在我的 iPad 应用程序中绘制一些图表，所以我遵循了本教程: http://recycled-parts.blogspot.com/2011/07/setting-up-coreplot-in

首页

博学

6Ren·AI

商城

r - 将多列组合成整洁的数据