- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
每个opportunityID有多个产品我想要一个二进制列,说明机会是否有此产品。如何做到这一点?
输入
+---+---------------+--------+----------+----------+
| | Opportunityid | Level | Product1 | Product2 |
+---+---------------+--------+----------+----------+
| 1 | 10 | Low | SS | ISP |
| 2 | 20 | High | ISP | Azure |
| 3 | 30 | Normal | Azure | ISP |
| 4 | 40 | | SS | |
| 5 | 50 | | ISP | |
+---+---------------+--------+----------+----------+
预期输出(检查产品 1 和产品 2)
+---+---------------+--------+----------+----------+--------+---------+-----------+
| | Opportunityid | Level | Product1 | Product2 | HasSS? | HasISP? | HasAzure? |
+---+---------------+--------+----------+----------+--------+---------+-----------+
| 1 | 10 | Low | SS | ISP | 1 | 1 | 0 |
| 2 | 20 | High | ISP | Azure | 0 | 1 | 1 |
| 3 | 30 | Normal | Azure | ISP | 0 | 1 | 1 |
| 4 | 40 | | SS | | 1 | | 0 |
| 5 | 50 | | ISP | | 0 | 1 | 0 |
+---+---------------+--------+----------+----------+--------+---------+-----------+
代码
library(caret)
Products <- data.frame(
Opportunityid=c(10, 20, 30, 40, 50),
Level=c('Low', 'High', 'Normal', '', ''),
Product1=c('SS', 'ISP', 'Azure', 'SS', 'ISP'),
Product2=c('ISP', 'Azure', 'ISP', '',''))
# dummify the data
dmy <- dummyVars(" ~ .", data = Products)
trsf <- data.frame(predict(dmy, newdata = Products))
trsf
PS:我有100多种产品,所以我希望流程自动化
最佳答案
您可以使用 tidyverse
来清理数据:
library(tidyverse)
Products <- data.frame(
Opportunityid=c(10, 20, 30, 40, 50),
Level=c('Low', 'High', 'Normal', '', ''),
Product1=c('SS', 'ISP', 'Azure', 'SS', 'ISP'),
Product2=c('ISP', 'Azure', 'ISP', '',''),
stringsAsFactors = FALSE)
Products %>%
gather(key, value, Product1:Product2) %>% ## collect all Product columns
mutate(has = ifelse(value == '', '', 1)) %>% ## add a dummy variable
spread(value, has, fill = 0) %>% ## spread the values back in wider format
select(-key, -V1) %>% ## remove empty columns and former product column
group_by(Opportunityid, Level) %>% ## group by to collapse rows
summarise_at(vars(-(Opportunityid:Level)), funs(max)) ## collapse rows
# A tibble: 5 x 5
# Groups: Opportunityid [?]
# Opportunityid Level Azure ISP SS
# <dbl> <chr> <chr> <chr> <chr>
# 1 10 Low 0 1 1
# 2 20 High 1 1 0
# 3 30 Normal 1 1 0
# 4 40 "" 0 0 1
# 5 50 "" 0 1 0
关于r - 如何在 R 中进行一次热编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52253835/
我想要类似于以下伪代码的东西: while input is not None and timer = 5: print "took too long" else: print inp
如何将 MainEngine Observable 转换为 Cold?来自这个例子: public IObservable MainEngine { get
自从手表被发明以来,表盘的方圆之争就始终没有停下来过,在漫长的岁月中,无论是方形还是圆形表盘,人们都为其寻找到足够多的设计元素,让其肆意成长,这种生机与活力后来也延续到了智能手表上,在2014年,这
我正在学习 CUDA,试图解决一些标准问题。例如,我正在使用以下代码求解二维扩散方程。但我的结果与标准结果不同,我无法弄清楚。 //kernel definition __global__ void
我的 Web 应用程序使用 native dll 来实现其部分功能(其位置在 PATH 中提供)。一切正常,直到我对 WAR 进行更改并且 JBoss 热部署此 WAR。此时dll已经找不到了,需要手
我看到这个问题here 。这是关于实现每个发出的项目的延迟。这是根据accepted answer如何实现的: Observable.zip(Observable.range(1, 5) .g
我最近一直在进行冷迁移...这意味着我无法在进行迁移时从应用程序级别读取/写入数据库(维护页面)。 这样就不会因为更改结构而发生错误,而且如果负载很大,我也不希望 mysql 在迁移过程中崩溃。 我的
我是一名优秀的程序员,十分优秀!