- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
考虑 data
其中包含以下一些 nan:
Column-1 Column-2 Column-3 Column-4 Column-5
0 NaN 15.0 63.0 8.0 40.0
1 60.0 51.0 NaN 54.0 31.0
2 15.0 17.0 55.0 80.0 NaN
3 54.0 43.0 70.0 16.0 73.0
4 94.0 31.0 94.0 29.0 53.0
5 99.0 52.0 77.0 91.0 58.0
6 84.0 19.0 36.0 NaN 97.0
7 41.0 91.0 62.0 67.0 68.0
8 44.0 38.0 27.0 53.0 37.0
9 58.0 NaN 63.0 57.0 28.0
10 66.0 68.0 89.0 36.0 47.0
11 7.0 81.0 5.0 99.0 16.0
12 43.0 55.0 64.0 88.0 NaN
13 8.0 90.0 91.0 44.0 4.0
14 29.0 52.0 94.0 71.0 47.0
15 22.0 21.0 68.0 61.0 38.0
16 76.0 36.0 70.0 99.0 50.0
17 38.0 31.0 66.0 79.0 99.0
18 94.0 22.0 92.0 39.0 58.0
data
中的 nan使用
sklearn.impute.IterativeImputer
.一个 friend 帮我写了下面的代码:
imp = IterativeImputer(missing_values=np.nan, sample_posterior=False,
max_iter=10, tol=0.001,
n_nearest_features=4, initial_strategy='median')
imp.fit(data)
imputed_data = pd.DataFrame(data=imp.transform(data),
columns=['Column-1', 'Column-2', 'Column-3', 'Column-4', 'Column-5'],
dtype='int')
imputed_data
是:
Column-1 Column-2 Column-3 Column-4 Column-5
0 59 15 63 8 40
1 60 51 66 54 31
2 15 17 55 80 48
3 54 43 70 16 73
4 94 31 94 29 53
5 99 52 77 91 58
6 84 19 36 59 97
7 41 91 62 67 68
8 44 38 27 53 37
9 58 46 63 57 28
10 66 68 89 36 47
11 7 81 5 99 16
12 43 55 64 88 47
13 8 90 91 44 4
14 29 52 94 71 47
15 22 21 68 61 38
16 76 36 70 99 50
17 38 31 66 79 99
18 94 22 92 39 58
IterativeImputer
documentation ,默认估计量是
BayesianRidge()
.但是如果我使用其他估算器,例如
estimator=ExtraTreesRegressor(n_estimators=10, random_state=0)
就像下面的代码一样,它返回一条警告消息。
imp = IterativeImputer(estimator=ExtraTreesRegressor(n_estimators=10, random_state=0), missing_values=np.nan, sample_posterior=False,
max_iter=10, tol=0.001,
n_nearest_features=4, initial_strategy='median')
imp.fit(data)
C:\Users\...\sklearn\impute\_iterative.py:599: ConvergenceWarning: [IterativeImputer] Early stopping criterion not reached. " reached.", ConvergenceWarning).
最佳答案
他们在这里遇到了同样的问题:
https://github.com/scikit-learn/scikit-learn/issues/14338
关于python - sklearn.impute.IterativeImputer 的实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57154209/
我的代码无法正常工作,因为我从机器学习 A-Z™:数据科学中的 Python 和 R 实践教程类(class)中逐字复制。我使用的是 Python 3.7,我已经在我的环境中安装了 scikit-le
我正在尝试在 google cloud ai 平台上创建一个版本,但找不到 impute 模块 No module named 'sklearn.impute._base; 'sklearn.impu
我正在对数据集进行预处理,我得到了该行的错误原因 imputer = imputer.fit(X [:,1:3])。我不明白哪个?我理解imputer = Imputer(missing_values
问题是我无法从 sklearn 导入模块。 from sklearn.impute import SimpleImputer ModuleNotFoundError: No module named
print(np.shape(ar_fulldata_input_xx)) Output: (9027, 1443) 现在,我使用 Imputer 来估算数据帧 ar_fulldata_input_x
我目前正在学习 sklearn imputer我发现有一种策略没有被 imputers 实现。 我想构建一个管道,删除具有任何缺失值的列或删除所有具有缺失值的行。 我为什么要这个? 因为我想进行网格搜
我正在尝试使用 Imputer 来查找缺失值。我还想跟踪具有所有缺失值的列,但因为否则我不知道其中哪些(列)已被处理:是否还可以返回包含所有缺失值的列? Impute Notes When axis=
我有一个包含缺失值 NaN 的特征矩阵,因此我需要先初始化这些缺失值。但是,最后一行提示并抛出以下错误行:预期序列或类数组,得到 Imputer(axis=0, copy=True, missing_
目前我正在尝试用 pandas 估算因变量。 (不要问为什么。)这是数据集 y.head(15) Out[138]: 0 13495.0 1 16500.0 2 16500.0
我有以下问题:我有一个 pandas 数据框,其中缺失值由字符串 na 标记。我想在其上运行一个 Imputer 以用列中的平均值替换缺失值。根据 sklearn 文档,参数 missing_valu
我试图在数据框中填充我的 NA 数据。我做了简单的数据: library(mice) first <- c(1,2,3,4,5,NA,7,8,9,NA) second<- c(1,2,NA,4,5,6
我不确定为什么,但在应用 knn.impute 时出现以下错误: Error in storage.mode(use.data) <- "double" : (list) object canno
考虑 data其中包含以下一些 nan: Column-1 Column-2 Column-3 Column-4 Column-5 0 NaN 15.0 63.0
有没有办法让 Scikit-learn Imputer 查找并替换多个被视为“缺失值”的值? 例如,我想做类似的事情 imp = Imputer(missing_values=(7,8,9)) 但根据
我正在练习机器学习中的数据集,在获取缺失值时,我使用了 imputer 类,但它给了我一个错误:数组索引太多。对于这个错误,我只是查看了所有 numpy 模块,但我没有任何想法来解决它。 import
有没有办法使用 sklearn.preprocessing 对象来估算分类值?我想最终创建一个预处理对象,我可以将其应用于新数据并以与旧数据相同的方式对其进行转换。 我正在寻找一种方法来做到这一点,以
docs对于 scikit-learn 的 Imputation transformer 说 When axis=0, columns which only contained missing val
我有一个包含 332 列的数据框。我想估算值以便能够使用 scikit-learn 的决策树分类器。我的问题是 imputer 函数的结果数据列只有 330。 from sklearn.preproc
我想在数据帧的所有 float64 列上使用 DataFrameMapper Imputer+Scaler 映射。我的代码适用于 StandardScaler,但当我添加 Imputer 时,映射器仅
import numpy as np import matplotlib.pyplot as plt import pandas as pd #Import Data set dataset= pd.
我是一名优秀的程序员,十分优秀!