python - 自定义转换器添加附加列-6ren

python - 自定义转换器添加附加列

转载作者：行者123 更新时间：2023-12-05 05:49:41

26

4

<分区>

我正在尝试将我的 lambda 函数复制到我的管道中

def determine_healthy(_list):
    if ('no' in _list['smoker'] and (_list['bmi'] >= 18.5) and (_list['bmi']<= 24.9)):
        return True
    else:
        return False

df['healthy'] = df.apply(lambda row: determine_healthy(row), axis=1)

当我将它集成到我的管道中时，问题就来了，我不确定问题是否在于添加了一个额外的“健康”列。当我尝试转换我的 X_train 时抛出此错误

from sklearn.base import BaseEstimator, TransformerMixin

class HealthyAttributeAdder(BaseEstimator, TransformerMixin):
    def __init__(self, items=None):
        if items is None: items = []
        self.l = items
    def fit(self, X , y=None):
        return self
    def transform(self, X):
        #X = X.copy()
        temp_cols = X.columns.to_list()
        temp_cols = temp_cols.append('healthy')
        new_cols = {k:v for k,v in zip(range(len(temp_cols)),temp_cols)}
        healthy = X.apply(lambda row: determine_healthy(row), axis=1)
        combined_df = pd.DataFrame(np.c_[X, healthy]).rename(columns=new_cols)
        return combined_df

num_col = ['age','bmi']
cat_col = ['sex', 'smoker','region','children','healthy']
y = df.pop('charges')
X = df 
all_col = X.columns
X_train, X_test, y_train, y_test = train_test_split(X,y , test_size=0.2, random_state = 42)

transform_pipeline = ColumnTransformer([
    ('healthy', HealthyAttributeAdder(), all_col),
    ('ss', StandardScaler(), num_col),
    ('ohe', OneHotEncoder(drop='first'), cat_col),
])

price_pipeline = Pipeline([
    ('transform', transform_pipeline),
    ('lasso',Lasso())
])

health_transform = HealthyAttributeAdder()
health_transform.fit_transform(X_train)
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_19796/500623650.py in <module>
----> 1 health_transform.fit_transform(X_train)

~\Venv\hdbtest\lib\site-packages\sklearn\base.py in fit_transform(self, X, y, **fit_params)
    850         if y is None:
    851             # fit method of arity 1 (unsupervised transformation)
--> 852             return self.fit(X, **fit_params).transform(X)
    853         else:
    854             # fit method of arity 2 (supervised transformation)

~\AppData\Local\Temp/ipykernel_19796/3713134512.py in transform(self, X)
     11         temp_cols = X.columns.to_list()
     12         temp_cols = temp_cols.append('healthy')
---> 13         new_cols = {k:v for k,v in zip(range(len(temp_cols)),temp_cols)}
     14         healthy = X.apply(lambda row: determine_healthy(row), axis=1)
     15         combined_df = pd.DataFrame(np.c_[X, healthy]).rename(columns=new_cols)

TypeError: object of type 'NoneType' has no len()

当我用它来预测时出错:

price_pipeline.fit(X_train,y_train)
y_pred = price_pipeline.predict(X_test)
---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
~\Venv\hdbtest\lib\site-packages\pandas\core\indexes\base.py in get_loc(self, key, method, tolerance)
   3360             try:
-> 3361                 return self._engine.get_loc(casted_key)
   3362             except KeyError as err:

~\Venv\hdbtest\lib\site-packages\pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc()

~\Venv\hdbtest\lib\site-packages\pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item()

pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item()

KeyError: 'healthy'

The above exception was the direct cause of the following exception:

KeyError                                  Traceback (most recent call last)
~\Venv\hdbtest\lib\site-packages\sklearn\utils\__init__.py in _get_column_indices(X, key)
    432             for col in columns:
--> 433                 col_idx = all_columns.get_loc(col)
    434                 if not isinstance(col_idx, numbers.Integral):

~\Venv\hdbtest\lib\site-packages\pandas\core\indexes\base.py in get_loc(self, key, method, tolerance)
   3362             except KeyError as err:
-> 3363                 raise KeyError(key) from err
   3364 

KeyError: 'healthy'

The above exception was the direct cause of the following exception:

ValueError                                Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_19796/993407432.py in <module>
----> 1 price_pipeline.fit(X_train,y_train)
      2 y_pred = price_pipeline.predict(X_test)

~\Venv\hdbtest\lib\site-packages\sklearn\pipeline.py in fit(self, X, y, **fit_params)
    388         """
    389         fit_params_steps = self._check_fit_params(**fit_params)
--> 390         Xt = self._fit(X, y, **fit_params_steps)
    391         with _print_elapsed_time("Pipeline", self._log_message(len(self.steps) - 1)):
    392             if self._final_estimator != "passthrough":

~\Venv\hdbtest\lib\site-packages\sklearn\pipeline.py in _fit(self, X, y, **fit_params_steps)
    346                 cloned_transformer = clone(transformer)
    347             # Fit or load from cache the current transformer
--> 348             X, fitted_transformer = fit_transform_one_cached(
    349                 cloned_transformer,
    350                 X,

~\Venv\hdbtest\lib\site-packages\joblib\memory.py in __call__(self, *args, **kwargs)
    347 
    348     def __call__(self, *args, **kwargs):
--> 349         return self.func(*args, **kwargs)
    350 
    351     def call_and_shelve(self, *args, **kwargs):

~\Venv\hdbtest\lib\site-packages\sklearn\pipeline.py in _fit_transform_one(transformer, X, y, weight, message_clsname, message, **fit_params)
    891     with _print_elapsed_time(message_clsname, message):
    892         if hasattr(transformer, "fit_transform"):
--> 893             res = transformer.fit_transform(X, y, **fit_params)
    894         else:
    895             res = transformer.fit(X, y, **fit_params).transform(X)

~\Venv\hdbtest\lib\site-packages\sklearn\compose\_column_transformer.py in fit_transform(self, X, y)
    670         self._check_n_features(X, reset=True)
    671         self._validate_transformers()
--> 672         self._validate_column_callables(X)
    673         self._validate_remainder(X)
    674 

~\Venv\hdbtest\lib\site-packages\sklearn\compose\_column_transformer.py in _validate_column_callables(self, X)
    350                 columns = columns(X)
    351             all_columns.append(columns)
--> 352             transformer_to_input_indices[name] = _get_column_indices(X, columns)
    353 
    354         self._columns = all_columns

~\Venv\hdbtest\lib\site-packages\sklearn\utils\__init__.py in _get_column_indices(X, key)
    439 
    440         except KeyError as e:
--> 441             raise ValueError("A given column is not a column of the dataframe") from e
    442 
    443         return column_indices

ValueError: A given column is not a column of the dataframe

26

4

0

文章推荐： c++ - C++ 中的运算符重载(复制构造函数和析构函数)

文章推荐： java - 在循环排序的数组中搜索 Java

JavaScript 转换器
我在完成这个用于转换咖啡价格的 JavaScript 时遇到问题。我下载了一个调试器，它一直告诉我价格未定义，我不明白。这是脚本。 Coffee House
非持久化实体的 JSF 转换器
我有一个使用以下方法的 JSF 转换器: @Override public Object getAsObject(FacesContext context, UIComponent compo
audio - 免费的声音编辑器/转换器？
我正在寻找类似paint.net 或Gimp 的东西，但对于音频文件，并在Windows 上运行。最佳答案 Audacity太棒了关于audio - 免费的声音编辑器/转换器？，我们在Stack
Java 转换器 setOutputProperty()
我目前正在使用以下代码来缩进 XML: transformer.setOutputProperty(OutputKeys.INDENT, "yes"); transformer.setOutputPr
java - JSF 转换器
我收到以下错误:Conversion Error setting value 'home' for 'null Converter'. Home是所显示内容的字符串表示形式。对我来说，这没有意义。这
具有不同十进制数的 wpf 转换器
我的 UI 中有很多数字要处理。我希望它们中的一些没有小数位，一些是小数点后 2 位，而另一些是小数点后(3 位或 4 位小数)。我有一个名为 DoubleToStringConverter 的转换
Python 转换器 - 我卡住了
我正在制作一个货币转换器。转换器需要一个最小范围和最大范围，如果货币值高于或低于这些范围，转换器将要求您更改范围以能够转换货币。例如，如果用户将范围设置在 min-range 3 和 max-rang
java - 动态注册命令的参数解析/转换器
我正在使用 Spring Shell 2 CLI，并尝试通过反射在运行时从定义的接口(interface)生成命令。更新:接口(interface)的实现也是在运行时生成的。我正在使用 Confi
java - 将参数传递给 jpa 转换器
我正在尝试编写一个通用的 Converter 以在我的代码中的多个类似情况下使用。我有一组子类，我只想使用一个 Converter 来处理，所以我想将一些东西(类类型/一些参数/等)传递给 Conve
csv - 未知列的 read_csv 转换器
我正在尝试读取一个在每个单元格中包含多个值的 csv 文件，并且我想将它们编码为单个 int 格式的字节以存储在 Pandas 单元格中，(例如 (1, 1) -> 771)。为此，我想使用 read
c# - 不同命名空间中的 XAML 转换器
我正在 VC2013 中开发一个 c# Windows Phone 8.1 应用程序，并偶然发现了一个奇怪的问题。为了使我的代码更“干净”，我决定将应用程序的不同部分放入不同的文件夹中。在 c# 代
converter - puppet Chef 转换器
是否有将 Puppet 脚本转换为 Chef 的转换器？我找到了将 Chef 脚本转换为 Puppet 的 ruby 脚本 https://github.com/relistan/chef2pu
spring - 自定义 Cassandra 转换器
我已经开始寻找很好的解决方案，如何使用 Spring CassandraOperations 很好地持久化实体。问题开始是因为我的实体中的某些字段不受 cassandra 支持，例如乔达日期时间。解
javascript - 是否有有效的数组 monad 转换器？
我知道如何实现单链表 monad 转换器，但无法运行其对应的数组。问题是存在分组效应，这使得转换器仅对可交换基 monad 有效。这是一个示例，为了简单起见，转换器和基础 monad 都是数组，并且没
wpf - 使用资源作为转换导致绑定(bind)转换器
当我尝试将值转换器从定义的枚举状态绑定(bind)到刷子时，我的 XAML 设计器中出现错误: 未找到“OKStatus”资源。该应用程序在运行时运行良好，但我无法在设计器中看到我的 GUI。我的
haskell - 列出单子(monad)转换器
我需要使用列表单子(monad)变压器。我读到 ListT IO 存在潜在问题来自 Control.Monad.List , 自 IO不是可交换的，所以我在看 ListT done right .但我
sql - 序言到 SQL 转换器
不用多想，在我看来，一大组 Prolog 的功能可以实现为关系演算(a.k.a. SQL)。有没有人听说过任何工具可以自动将 Prolog 转换为 SQL？最佳答案推荐: https://www
R 十六进制到 RGB 转换器
假设我在十六进制值(包括 alpha)中有这种颜色: x [1] "255 36 0" 但是，查看您请求的结果，您似乎在 x 中将 alpha 值作为第一个十六进制数。 - 所以你需要创建一个子字符
haskell - 用于进度跟踪的 Monad 转换器
我正在寻找可用于跟踪程序进度的 monad 转换器。要解释如何使用它，请考虑以下代码: procedure :: ProgressT IO () procedure = task "Print som
nHibernate 连接多个表并使用 AliasToBean 转换器
我有一个非常基本的需求，即从数据库中获取一些数据并返回一个 DTO。我发现使用 nHibernate 连接多个表和“投影”可以说，到 DTO 是相当多的代码。在查看了几个示例后，大多数示例都不起作用，

首页

博学

6Ren·AI

商城

python - 自定义转换器添加附加列