data.frame 上的重构魔法-6ren

data.frame 上的重构魔法

转载作者：行者123 更新时间：2023-12-02 04:55:49

25

4

我目前正在学习使用 data.frame，并且对如何重新排序它们感到非常困惑。

目前，我有一个 data.frame 显示:

第 1 列:商店名称
第 2 列:产品
第3栏:该店铺购买该商品的数量

或者视觉上是这样的:

+---+-----------+-------+----------+--+
|   | Shop.Name | Items | Product  |  |
+---+-----------+-------+----------+--+
| 1 | Shop1     |     2 | Product1 |  |
| 2 | Shop1     |     4 | Product2 |  |
| 3 | Shop2     |     3 | Product1 |  |
| 4 | Shop3     |     2 | Product1 |  |
| 5 | Shop3     |     1 | Product4 |  |
+---+-----------+-------+----------+--+

我想要实现的是以下“以商店为中心”的结构:

第 1 列:商店名称
第 2 列:产品 1 的售出商品
第 3 列:产品 2 的售出商品
第 4 列:产品 3 的售出商品...

当特定商店/产品没有排队时(因为没有销售)，我想创建一个 0。

或

+---+-------+-------+-------+-------+-------+-----+--+--+
|   | Shop  | Prod1 | Prod2 | Prod3 | Prod4 | ... |  |  |
+---+-------+-------+-------+-------+-------+-----+--+--+
| 1 | Shop1 |     2 |     4 |     0 |     0 | ... |  |  |
| 2 | Shop2 |     3 |     0 |     0 |     0 | ... |  |  |
| 3 | Shop3 |     2 |     0 |     0 |     1 | ... |  |  |
+---+-------+-------+-------+-------+-------+-----+--+--+

最佳答案

到目前为止的答案在一定程度上有效，但并没有完全回答您的问题。特别是，它们没有解决没有商店出售特定产品的情况。从您的示例输入和所需输出来看，没有商店出售“Product3”。事实上，“Product3”甚至没有出现在您的源 data.frame 中。此外，它们没有解决每个商店 + 产品组合具有多行的可能情况。

这是您的数据的修改版本以及迄今为止的两个解决方案。我为“Shop1”和“Product1”的组合添加了另一行。请注意，我已将您的产品转换为一个factor 变量，其中包括该变量可以采用的级别，即使没有一个案例实际上具有该级别。

mydf <- data.frame(
  Shop.Name = c("Shop1", "Shop1", "Shop2", "Shop3", "Shop3", "Shop1"),
  Items = c(2, 4, 3, 2, 1, 2),
  Product = factor(
    c("Product1", "Product2", "Product1", "Product1", "Product4", "Product1"),
    levels = c("Product1", "Product2", "Product3", "Product4")))

dcast 来自“reshape2”

library(reshape2)
dcast(mydf, formula = Shop.Name ~ Product, value="Items", fill=0)
# Using Product as value column: use value.var to override.
# Aggregation function missing: defaulting to length
# Error in .fun(.value[i], ...) : 
#   2 arguments passed to 'length' which requires 1

什么？突然不行了。改为这样做:

dcast(mydf, formula = Shop.Name ~ Product, 
      fill = 0, value.var = "Items", 
      fun.aggregate = sum, drop = FALSE)
#   Shop.Name Product1 Product2 Product3 Product4
# 1     Shop1        4        4        0        0
# 2     Shop2        3        0        0        0
# 3     Shop3        2        0        0        1

我们还是老派吧。 cast 来自“reshape”

library(reshape)
cast(mydf, formula = Shop.Name ~ Product, value="Items", fill=0)
# Aggregation requires fun.aggregate: length used as default
#   Shop.Name Product1 Product2 Product4
# 1     Shop1        2        1        0
# 2     Shop2        1        0        0
# 3     Shop3        1        0        1

呃。又不是你想要的...试试这个:

cast(mydf, formula = Shop.Name ~ Product, 
     value = "Items", fill = 0, 
     add.missing = TRUE, fun.aggregate = sum)
#   Shop.Name Product1 Product2 Product3 Product4
# 1     Shop1        4        4        0        0
# 2     Shop2        3        0        0        0
# 3     Shop3        2        0        0        1

让我们回到基础知识。来自基础 R 的 xtabs

xtabs(Items ~ Shop.Name + Product, mydf)
#          Product
# Shop.Name Product1 Product2 Product3 Product4
#     Shop1        4        4        0        0
#     Shop2        3        0        0        0
#     Shop3        2        0        0        1

或者，如果您更喜欢 data.frame(请注意，您的“Shop.Name”变量已转换为 data 的 row.names .frame):

as.data.frame.matrix(xtabs(Items ~ Shop.Name + Product, mydf))
#       Product1 Product2 Product3 Product4
# Shop1        4        4        0        0
# Shop2        3        0        0        0
# Shop3        2        0        0        1

关于data.frame 上的重构魔法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14508199/

25

4

0

文章推荐： .net - WCF--优点和缺点

文章推荐： java - 使用 PDFBox 将图像转换为 byte[]

文章推荐： delphi - 设置第二个 TFDPhysFBDriverLink - 可能且必要吗？

文章推荐： java - Java 中枚举列表的结尾

CoffeeScript 重构
是否有任何特定于 CoffeeScript 的技巧可以使这看起来更整洁: index = (-> if segment == 'index' return
If语句的C#重构
我正在试验 C# 的不同领域并重构最佳实践/模式。可以看出，下面的 Validate 方法有 3 个子验证方法。有没有办法重新设计/重构此方法，以便删除 if 语句？ (可能使用委托(delega
Ruby 重构
我正在制作一个简单的 Rails 站点，它将存储一些日期并执行基本的条件检查。我在下面写了一些方法，并被告知我可以使它们更有效率。我一直挠头，我不知道该怎么做。我应该让 entry.find 全局化吗
JavaScript 重构
有没有更好的方法来编写这个函数？我继承了一些 javascript 代码，如果可能的话，我想让它更简洁。此外，我可能会添加更多“主题”元素，并且不想一遍又一遍地复制和粘贴。 function imag
重构：banner中logo聚合分散动画
1. 效果展示在线查看 2. 开始前说明效果实现参考源码： Logo 聚集与散开原效果代码基于 react jsx 类组件实现。依赖旧，代码冗余。
java - 重构:删除构造函数中的重复项
我似乎缺乏足够的咖啡来让我清楚地看到以下问题。假设我有一个包含两个构造函数和多个字段的类。一个构造函数是无参数构造函数，一个字段依赖于另一个字段。另一个构造函数为其其中一个字段获取注入(inject
java - 修改此代码的更好方法是什么[重构]
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎是题外话，因为它缺乏足够的信息来诊断问题。更详细地描述您的问题或include a min
java - 重构 if 语句以使用适当的模式
我有一个枚举，里面有一些状态: enum State { A, B, C, D } 以及具有相应状态的对象: class MyObject { State st
Ant exec 重构
我的 build.xml 中有这段代码:
delphi - 重构 - 如何防止重构选项卡显示？
在Delphi XE中，我经常使用重命名变量重构(Ctrl+Shift+E)，通过给出更有意义的变量名称来使我的代码更容易理解，例如: 这一切都很好，但是当我使用它时，我在工作空间方面遇到了一个小问题
javascript - 计算State数量——重构
我实现了一个逻辑来通过data变量计算剩余数量和成本。它循环遍历每个产品，并通过计算已返回数量状态的数量来计算剩余数量，并减去产品数量。有没有办法重构这段代码，使其看起来更干净、易于理解/可维护？我
haskell - 重构 where 子句
我正在学习 Haskell，所以这可能是一些非常微不足道的事情，但我希望得到一些关于如何重写它以及它如何工作的指示。我有以下工作代码(使用的包: HTF 、 Parsec 和 Flow ): {-#
JavaScript 重构。处理重复代码
我有以下代码: switch(equipmentAttachment.AttachmentPosition) { case 'AttachFront': { if(
java - Eclipse 重构
我正在尝试将代码从 Java Utility Logging 更改为 Log4J2。要更改代码，我想在 Eclipse 中使用代码重构。例如更改:导入 java.util.logging.Logger
excel - 重构 - 本例中使用哪种模式？
我有一个处理 Excel 文件中的行的函数。在这个函数中，我有一个 for 循环。现在，一旦提取一行，我们就会检查各种条件。如果任何条件为假，我们继续下一步row.可以使用模式使这段代码更加结构化吗？
java - 重构、嵌套方法调用
我正在重构一个有很多嵌套调用的程序，例如 ServiceManagement.getGlobalizationService() .createExportCo
java - 重构 JTextField
我在 JTabbedPane 上重构了许多字段以减少冗余。但是，当我为字段数量设置常量大小时，出现空指针异常。我不太确定为什么会发生这种情况。我做错了什么，更重要的是有人可以解释发生了什么事吗？ pu
java - 重构——结合PolygonClickListener和MarkerClickListener
我试图通过删除 map.setOnPolygonClickListener 和 map.setOnMarkerClickListener 中的重复项来重构以下方法。两个监听器执行完全相同的操作，我想
java - 重构/重新设计大型系统
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 6 年前。 Improve this ques
ios - 重构 Storyboard时如何交换标签栏项目的位置
当我在这张照片中重构 Storyboard时 link . 我找不到在哪里可以交换标签栏项目的位置。例如，我想将主菜单更改为索引 0。这是我的storyboard . 最佳答案您可以通过拖放标签

首页

博学

6Ren·AI

商城

data.frame 上的重构魔法