- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试使用 sklearn_pandas DataFrameMapper。这会接收列名称以及该列所需的预处理转换函数。像这样,
mapper = sklearn_pandas.DataFrameMapper([
('hour',None),
('season',sklearn.preprocessing.OneHotEncoder()),
('holiday',None)
])
season 是我的 pandas DataFrame 中的一个 int64 列。
这给了我以下错误 - 要解压的值太多。我知道 OneHotEncoder 采用二维样本而不是一维样本。
我如何才能将此 OneHotEncoder 与 sklearn_pandas 一起使用,还是不可能。
最佳答案
sklearn-pandas
官方版在处理一维数组和转换时存在一些问题。试试下面的 fork : https://github.com/dukebody/sklearn-pandas
但是,我认为您可以使用 LabelBinarizer
(如在 sklearn_pandas
示例中)代替 OneHotEncoder
来完成您想要的。
2015 年 11 月 28 日更新
在 sklearn-pandas>=0.0.12
中,您可以通过执行以下操作解决您的问题:
mapper = sklearn_pandas.DataFrameMapper([
('hour',None),
(['season'],sklearn.preprocessing.OneHotEncoder()),
('holiday',None)
])
来自文档:
The difference between specifying the column selector as
'column'
(as a simple string) and['column']
(as a list with one element) is the shape of the array that is passed to the transformer. In the first case, a one dimensional array with be passed, while in the second case it will be a 2-dimensional array with one column, i.e. a column vector.
关于python - 将 OneHotEncoder 与 sklearn_pandas DataFrameMapper 结合使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30010853/
我一直在尝试安装 sklearn_pandas 包。我尝试了网上找到的两种方法: 1) 通过在 Windows 命令行中与我的 Python 工作目录相同的位置运行“pip install sklea
我正在尝试使用 sklearn_pandas DataFrameMapper。这会接收列名称以及该列所需的预处理转换函数。像这样, mapper = sklearn_pandas.DataFrameM
我想安装 sklearn_pandas通过 Windows 命令行使用 conda 库。该软件包在 conda 存储库中显然是“私有(private)的”(诚然,这很可能是我无法安装它的原因,但我更愿
我有一个具有分类和数字特征的数据集,我想在其上应用一些转换,然后是 XGBClassifier。 数据集链接:https://www.kaggle.com/blastchar/telco-custom
我正在尝试使用 sklearn_pandas 模块来扩展我在 pandas 中所做的工作,并涉足机器学习,但我正在努力解决一个我不太明白如何修复的错误。 我正在 Kaggle 上处理以下数据集. 它本
我是一名优秀的程序员,十分优秀!