- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我记得在 R 中我使用了 the.factor (我相信它们是带有级别的因子),但在 python 中我不知道该怎么做。
它使用的是 get_dummies,但当训练数据集具有测试没有的值时,就会出现问题,从而生成比 ML 算法无法接受的更多的列。
我需要转换以下列:
train.head(5)
Id MSSubClass MSZoning
1 60 RL
2 53 RR
3 49 RL
4 60 RL
5 95 RR
6 16 RR
6 16 R1
我需要离开火车。MSZoning 如下:
MSZoning
1
2
1
1
2
2
3
谢谢。
最佳答案
您可以使用pd.Categorical
。以下是一个最小的可重现示例
import pandas as pd
data = [[1, 60, 'RL'], [2, 53, 'RR'], [3, 49, 'RL'], [4, 60, 'RL'], [5, 95, 'RR']]
df = pd.DataFrame(data, columns = ['Id', 'MSSubClass', 'MSZoning'])
df['MSZoning_factor'] = pd.Categorical(df.MSZoning).codes + 1
df
# Id MSSubClass MSZoning MSZoning_factor
#0 1 60 RL 1
#1 2 53 RR 2
#2 3 49 RL 1
#3 4 60 RL 1
#4 5 95 RR 2
或者使用pd.factorize
df['MSZoning_factor'] = pd.factorize(df.MSZoning)[0] + 1
给出相同的结果。
关于python - 在 python 中进行因式分解,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56502998/
我很抱歉提出一个关于 Eigen3 优化计算方案的一般性问题。假设我们确实拥有两个 Eigen3 矩阵,M 和 N。假设我们需要计算以下内容: Eigen::Matrix M; Eigen::Matr
如果我使用 Sympy 获得了以下方程: 是否可以排列变量,使 x 和 L 在方程中仅显示为 x/L? 最佳答案 用另一个符号(例如 y)替换 x/L 似乎对我有用: >>> import sympy
我不确定我的标题应该是什么。但是,我试图对我的代码进行很好的验证。以下是我的函数中唯一允许使用的代码:c0001、c0002、c0003、c0004、c0005、C0001、C0002、C0003、C
这周我开始较少样式表开发。 我当前的元素有许多不同颜色的链接,例如: #dev-team a { color: #D09EBA; } #admin-team a { color: #0
我试图通过分解 N 来找到 D。 我的 N 是 265291078722948385089717069136983657793 我发现 P & Q 使用 n = p.q P - 1471697682
这个问题在这里已经有了答案: Partitioning in JavaScript [duplicate] (7 个答案) 关闭 7 年前。 假设我有一个数组 = [0,1,2,3,4,5,6],我
我有这个数据框:基本上每一行都是一个客户一天执行的一笔交易。同一客户在同一天和不同日期进行多笔交易。我想获得一个列来显示客户之前访问的次数。 id date purchase id1 date1
我是一名优秀的程序员,十分优秀!