python - 如何使用 Featuretools 为没有直接特征的单个表创建特征？-6ren

python - 如何使用 Featuretools 为没有直接特征的单个表创建特征？

转载作者：太空宇宙更新时间：2023-11-04 00:02:50

24

4

我使用了@willk 的答案，但它弹出了一个错误。在这里查看威尔克的回答。 willk's anser我无法在他的回答中发表评论，因为我没有足够的声誉(超过 50)。

所以我的问题是如何使下面的代码工作？或者请提供一个解决方案，该解决方案使用 featuretools 为单个表应用自动特征工程(以 iris 为例)并且没有要规范化的直接特征(从现有表创建新表)。

from sklearn.datasets import load_iris
import pandas as pd 
import featuretools as ft

# Load data and put into dataframe
iris = load_iris()
df = pd.DataFrame(iris.data, columns = iris.feature_names)
df['species'] = iris.target
df['species'] = df['species'].map({0: 'setosa', 1: 'versicolor', 2: 'virginica'})

# Make an entityset and add the entity
es = ft.EntitySet(id = 'iris')
es.entity_from_dataframe(entity_id = 'data', dataframe = df, 
                     make_index = True, index = 'index')

# Run deep feature synthesis with transformation primitives
feature_matrix, feature_defs = ft.dfs(entityset = es, target_entity = 'data',
                                  trans_primitives = ['add', 'multiply'])
feature_matrix.head()

ValueError: ('Unknown transform primitive add.', 'Call ft.primitives.list_primitives() to get', '可用基元列表')

最佳答案

featuretools 的 0.6.1 版本更改了一些原始名称。下面的代码应该为你运行

from sklearn.datasets import load_iris
import pandas as pd 
import featuretools as ft

# Load data and put into dataframe
iris = load_iris()
df = pd.DataFrame(iris.data, columns = iris.feature_names)
df['species'] = iris.target
df['species'] = df['species'].map({0: 'setosa', 1: 'versicolor', 2: 'virginica'})

# Make an entityset and add the entity
es = ft.EntitySet(id = 'iris')
es.entity_from_dataframe(entity_id = 'data', dataframe = df, 
                     make_index = True, index = 'index')

# Run deep feature synthesis with transformation primitives
feature_matrix, feature_defs = ft.dfs(entityset = es, target_entity = 'data',
                                  trans_primitives = ['add_numeric', 'multiply_numeric'])
feature_matrix.head()

关于python - 如何使用 Featuretools 为没有直接特征的单个表创建特征？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55155371/

24

4

0

文章推荐： c - 你如何在 C 中的 BST 中删除一个数字的多个实例？

文章推荐： css - 容纳内部 div 的外部 div 太大了几个像素

文章推荐： python - 如何在 TensorFlow 2.0 中控制冗长

featuretools - 使用 featuretools 为预测模型生成标签
我目前正在使用我自己的数据完成功能工具演示 ( https://github.com/Featuretools/predict_next_purchase/blob/master/Tutorial.i
featuretools - 我们应该在 featuretools 中从 DFS 中排除目标变量吗？
在将数据帧作为实体集中的实体传递并在其上使用 DFS 时，我们是否应该从 DFS 中排除目标变量？在手动尝试传统特征选择方法并使用特征工具查看它是否提高了分数后，我有一个模型的 roc_auc 分数为
featuretools:如何为回归任务正确生成特征
我想尝试 featuretools，但我需要提示，如何将其用于我的数据集。我在 pandas 数据框中有数据，这是一个回归问题。这是我的数据集的示例: 我尝试了什么: import featuret
featuretools:如何为回归任务正确生成特征
我想尝试 featuretools，但我需要提示，如何将其用于我的数据集。我在 pandas 数据框中有数据，这是一个回归问题。这是我的数据集的示例: 我尝试了什么: import featuret
Python featuretools 按数据组差异
我正在尝试使用 featuretools 来计算时间序列函数。具体来说，我想通过组键(user_id)从前一个(x)中减去当前(x)，但是我在实体集中添加这种关系时遇到了麻烦。 df = pd.Dat
python - FeatureTools:time_index参数中可以有多列吗？
我在数据帧中有两个时间参数，即 start_date 和 end_date，当从数据帧创建实体集时，这两个参数都是时间参数。在指定 time_index 时，我们可以指定 2 个不同的列吗？我不想
python - 向实体添加变量 - featuretools
我正在尝试向实体添加新变量。我正在尝试添加如下变量: es['Product'].add_variable("inventory", data=inventory_series) 但是我收到了这个错
python - Featuretools 分类处理
Featuretools 提供了处理分类变量的集成功能 variable_types={"product_id": ft.variable_types.Categorical} https://doc
python - 时间序列问题的自动特征生成 - Featuretools
我正在尝试使用特征工具生成特征来帮助我预测下个月的博物馆参观次数。 featuretools 可以生成时间序列的特征吗？我应该更改数据以便 id 是月份还是 featuretools 可以自动执行？
python - FeatureTools:处理多对多关系
我有一个包含多个列的购买数据框，包括以下三个: PURCHASE_ID (index of purchase) WORKER_ID (index of worker) ACCOUNT_ID (i
featuretools - 在深度特征合成中使用多个父 ID 作为截止时间
我的数据看起来像:People <-- Events <--Activities。父对象是 People，其中唯一的变量是 person_id。 Events 和 Activity 都有一个时间索引，
python - 将参数传递给 featuretools 中的聚合基元
我正在使用 featuretools dfs 函数使用与时间相关的聚合原语(例如 TimeSince ( https://docs.featuretools.com/api_reference.htm
python - 未在 featuretools 中为我的实体集设置生成功能
当我尝试在实体集之间创建关系(使用我自己的数据)时遇到问题。没有错误，但它只是没有为我的实体之一(“prods”实体)创建功能，尽管一切都应该连接得很好。我无法共享我的数据，但我使用一些模拟数据创建
python - 如何使用 Featuretools 按列值从单个数据框中的多列创建特征？
我正在尝试根据之前的结果预测足球比赛的结果。我在 Windows 上运行 Python 3.6 并使用 Featuretools 0.4.1。假设我有以下表示结果历史记录的数据框。 Original
python - 在 Featuretools 中使用多个训练窗口计算相同的特征
Featuretools 已经支持处理多个截止时间 https://docs.featuretools.com/automated_feature_engineering/handling_time.
python - 如何使用 Featuretools 为没有直接特征的单个表创建特征？
我使用了@willk 的答案，但它弹出了一个错误。在这里查看威尔克的回答。 willk's anser我无法在他的回答中发表评论，因为我没有足够的声誉(超过 50)。所以我的问题是如何使下面的代码工
python - Featuretools:即使没有日期时间相关列，它是否可以应用于单个表以生成特征？
featuretools文档在其第一句话中指出: “Featuretools 是一个执行自动化特征工程的框架。它擅长将时间和关系数据集转换为机器学习的特征矩阵。” 这似乎暗示数据集必须有一个日期时间列
python - [featuretools ]'EntitySet' 对象没有属性 'entity_from_dataframe'
我尝试按照 featuretools.com 的文档学习功能工具。出现错误:AttributeError: 'EntitySet' 对象没有属性 'entity_from_dataframe' 你能
运行 dfs 时的 featuretools 进度条
使用 featuretools 时有没有办法在运行时显示进度条 dfs ？最佳答案在 dfs 中设置参数 verbose=True函数调用应该给你一个进度条。关于运行 dfs 时的 featur
python - 从 Python featuretools 中的特征工程中排除当前行
我正在使用 featuretools 为当前行生成历史特征。例如， session 期间最后一小时的交易数量。包 featuretools 包含参数 cutoff_time 以及时排除 cutoff

首页

博学

6Ren·AI

商城

python - 如何使用 Featuretools 为没有直接特征的单个表创建特征？