gpt4 book ai didi

python - 值错误 : Feature not in features dictionary

转载 作者:太空狗 更新时间:2023-10-29 20:13:23 25 4
gpt4 key购买 nike

我正在尝试使用 TensorFlow 编写一个简单的深度机器学习模型。我正在使用我在 Excel 中制作的玩具数据集,只是为了让模型工作并接受数据。我的代码如下:

import pandas as pd
import numpy as np
import tensorflow as tf

raw_data = np.genfromtxt('ai/mock-data.csv', delimiter=',', dtype=str)
my_data = np.delete(raw_data, (0), axis=0) #deletes the first row, axis=0 indicates row, axis=1 indicates column
my_data = np.delete(my_data, (0), axis=1) #deletes the first column

policy_state = tf.feature_column.categorical_column_with_vocabulary_list('policy_state', [
'AL', 'CA', 'MI'
])

modern_classic_ind = tf.feature_column.categorical_column_with_vocabulary_list('modern_classic_ind', [
'0', '1'
])

h_plus_ind = tf.feature_column.categorical_column_with_vocabulary_list('h_plus_ind', [
'0', '1'
])

retention_ind = tf.feature_column.categorical_column_with_vocabulary_list('retention_ind', [
'0', '1'
])

feature_columns = [
tf.feature_column.indicator_column(policy_state),
tf.feature_column.indicator_column(modern_classic_ind),
tf.feature_column.indicator_column(h_plus_ind)
]
classifier = tf.estimator.DNNClassifier(feature_columns=feature_columns,
hidden_units=[10, 20, 10],
n_classes=3,
model_dir="/tmp/ret_model")

train_input_fn = tf.estimator.inputs.numpy_input_fn(
x={"x": np.array(my_data[:, 0:3], dtype=str)},
y=np.array(np.array(my_data[:, 3], dtype=str)),
num_epochs=None,
shuffle=True)

classifier.train(input_fn=train_input_fn, steps=2000)

不幸的是,我收到以下错误。我试过从 csv 文件中删除标签而不是保留它们,将特征列命名为不同的东西,并更改 numpy 数组的类型。错误仍然存​​在。

ValueError:特征 h_plus_ind 不在特征字典中。

如果我删除 h_plus_ind,它只会在不同的列上抛出错误。

最佳答案

使用 tf.feature_columns 时,您在 input_fn 中输入的数据应该与之前创建的特征列具有相同的键。因此,train_input_fnx 应该是一个字典,其键以 feature_columns 命名。

一个模拟例子:

x = {"policy_state": np.array(['AL','AL','AL','AL','AL']),
"modern_classic_ind": np.array(['0','0','0','0','0']),
"h_plus_ind": np.array(['0','0','0','0','0']),}

侧面:

这很棒 article来自开发人员的谷歌博客可能是一个很好的阅读,因为它引入了一种使用 tf.Dataset API 直接从 csv 文件创建 input_fn 的新方法。它有更好的内存管理,避免将所有数据集加载到内存中。

关于python - 值错误 : Feature not in features dictionary,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47635507/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com