python - 在 pandas for python 中创建虚拟变量-6ren

python - 在 pandas for python 中创建虚拟变量

转载作者：IT老高更新时间：2023-10-28 22:02:24

33

4

我正在尝试使用 python 中的 pandas 从分类变量创建一系列虚拟变量。我遇到过 get_dummies 函数，但每当我尝试调用它时，我都会收到一个错误，即名称未定义。

任何创建虚拟变量的想法或其他方法将不胜感激。

编辑:由于其他人似乎遇到过这个问题，pandas 中的 get_dummies 函数现在可以正常工作了。这意味着以下应该可以工作:

import pandas as pd

dummies = pd.get_dummies(df['Category'])

见 http://blog.yhathq.com/posts/logistic-regression-and-python.html了解更多信息。

最佳答案

当我想到虚拟变量时，我会想到在 OLS 回归的上下文中使用它们，我会这样做:

import numpy as np
import pandas as pd
import statsmodels.api as sm

my_data = np.array([[5, 'a', 1],
                    [3, 'b', 3],
                    [1, 'b', 2],
                    [3, 'a', 1],
                    [4, 'b', 2],
                    [7, 'c', 1],
                    [7, 'c', 1]])                


df = pd.DataFrame(data=my_data, columns=['y', 'dummy', 'x'])
just_dummies = pd.get_dummies(df['dummy'])

step_1 = pd.concat([df, just_dummies], axis=1)      
step_1.drop(['dummy', 'c'], inplace=True, axis=1)
# to run the regression we want to get rid of the strings 'a', 'b', 'c' (obviously)
# and we want to get rid of one dummy variable to avoid the dummy variable trap
# arbitrarily chose "c", coefficients on "a" an "b" would show effect of "a" and "b"
# relative to "c"
step_1 = step_1.applymap(np.int) 

result = sm.OLS(step_1['y'], sm.add_constant(step_1[['x', 'a', 'b']])).fit()
print result.summary()

关于python - 在 pandas for python 中创建虚拟变量，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11587782/

33

4

0

文章推荐： linux - Linux 3.2 内核与 2.6 内核的不平衡套接字接受

文章推荐： python - 两个字典(键和值)的递归差异？

sql - 虚拟 where 子句对性能的影响
有WHERE 1=1有什么作用如果您在脚本(伪代码)中编写此请求: sql = "SELECT f1,f2,f3 FROM t WHERE 1=1" ++ restOfTheClause
R- 使用列表的值作为名称将列表的列转换为不同的列(虚拟)
这个问题已经有答案了: R: Convert delimited string into variables (3 个回答) 已关闭 5 年前。我有一个包含电影数据的表，在最后一列中，它包含电影所属
c++ - 虚拟/非虚拟继承
假设我有一个基类: struct A{ virtual void foo() = 0; }; 然后假设我有一个这样的派生类: struct B : public virtual A{ voi
c++ - 虚拟 << 运算符
我有一个小问题，我的 << 运算符没有被正确调用。这是我的: class SomeInterface { friend std::ostream& operator<<(std::ostrea
c++ - 虚拟/抽象方法如何在类图中显示？
首先，我来自 Java 社区，并且仍然是 C++ 的学习者。请看下面的类第二张图片显示了类“GameObject”的子类。它还有一个 Display() 方法。 GameObject类有5个子类，
C++，继承，虚拟
我这里遇到了一些问题。我试图让我的代码像 java 中的接口(interface)一样工作。这个类被其他 2 个继承，因为它们导致了一些问题。而且我还想知道我是否做对了，以及改进我的代码的方法。我是新
C++ 虚拟 + 保护？
在 C++ 中，我有一个基类 A，一个子类 B。两者都有虚方法 Visit。我想在 B 中重新定义“访问”，但 B 需要访问每个 A(以及所有子类)的“访问”功能。我有类似的东西，但它告诉我 B 无
c++ - 虚拟 final方法是否比根类中的非虚拟方法更好？
我有一个抽象类，它是类层次结构的根。该根类有一个带有一些简单实现的方法，似乎没有必要随时随地更改该实现。使该方法成为非虚方法很好，但是某些子类可能会意外地重新实现它。在这种情况下，虚拟 final方
c# - 抽象方法声明 - 虚拟？
在 MSDN 上，我发现在抽象方法声明中使用“virtual”修饰符是错误的。我的一位同事应该是非常有经验的开发人员，但他在他的代码中使用了这个: public abstract class Busi
C++(虚拟)函数表
C++ 虚函数表是仅用于确定调用虚函数时应该执行哪一段代码，还是在运行时有其他用途？在维基百科上，它列出了“动态调度”作为一个原因，但没有深入了解 C++ 的更多细节...... 最佳答案一些实现
linux/虚拟/物理页面大小
页面大小是否恒定？更具体地说，getconf PAGE_SIZE 给出 4096，这很公平。但这可以通过程序的运行时间改变吗？或者它在整个操作系统进程生成过程中是否保持不变。 IE。 , 进程是否可能
c++ - 为什么在删除派生类对象时调用基类析构函数(虚拟)？
析构函数(当然还有构造函数)和其他成员函数之间的区别在于，如果常规成员函数在派生类中具有主体，则仅执行派生类中的版本。而在析构函数的情况下，派生版本和基类版本都会被执行？很高兴知道在析构函数(可能是
c++ - 虚拟/纯虚拟解释
如果一个函数被定义为虚函数并且与纯虚函数相同，这究竟意味着什么？最佳答案来自 Wikipedia's Virtual function... In object-oriented programm
java - 获取应用服务器下的真实(虚拟)主机名
我有一个在 Jetty 下运行的应用程序，我希望该应用程序返回自引用绝对 URL(生成 RSS 提要时，因此客户端必须能够在没有“当前 URL”上下文的情况下工作)。问题是我事先不知道应用程序将部署
delphi - 虚拟 TreeView 拖动
如何在两个virtualtreeview之间复制以复制所有列，而不仅仅是第一列？复制前：复制后：最佳答案树控件不保存任何数据。它不包含要显示的列数据，因此无法复制它。而是，当树控件想要显示任何
delphi - 虚拟 TreeView 提示未显示
我已将 ShowHint 设置为 true 并将 HintMode 设置为 hmToolTip，但是当我将光标悬停在控件上时，我的 OnGetHint() 事件处理程序甚至没有断点。知道我做错了什么
delphi - 虚拟 TreeView 。如何修改子列宽度？
我的 friend 正在 Delphi 中使用 VirtualTreeView 工作，并且遇到了下一个问题:他有两列，第一列的每一行都有数据和子项。是否可以不更改第一列宽度来设置最大子列宽度？图例:
delphi - 虚拟 TreeView 中可以有多个扩展节点吗？
我在我的 Virtual TreeView Component 中使用 TVirtualStringTree ( Delphi project 的一部分)我想创建一个 View ，其中 2 列可以有可
delphi - 虚拟 TreeView 循环
我想遍历 VirtualTreeView 的所有根并将其删除。我不想清除它。我收到此代码的访问冲突: var Node : PVirtualNode; begin if VirtualStri
php - 虚拟 PHP 表单
我有一个可以输出表单的 PHP 文件。我想在服务器端调用这个 PHP 文件(当前使用“include”)，填写并提交。这样更好，因此我不必干预实际的 PHP 表单，只需处理表示层，以便数据可以被它自

首页

博学

6Ren·AI

商城

python - 在 pandas for python 中创建虚拟变量