gpt4 book ai didi

python - tf.contrib.layers.sparse_column_with_integerized_feature 可以处理一列中具有多个输入的分类特征吗?

转载 作者:行者123 更新时间:2023-11-30 09:19:43 25 4
gpt4 key购买 nike

我只是使用 Tensorflow 及其 tf.learn api 来创建和训练 DNNRegressor 模型。我有一个多价整数特征列(每一行的该列中可以有多个整数值),并且我对此特征列使用 tf.contrib.layers.sparse_column_with_integerized_feature。

现在我的问题是 csv 文件中多价特征列的正确分隔符是什么。例如,假设我有一个 csv,其中 col2 是多价特征,并且它不是一个热门特征:

  1, 2, 1:2:3:4, 5
2, 1, 4:5, 6

如您所见,我使用“:”来分隔 col2 中的整数特征值,但它似乎不正确,我在运行 DNNRegressor 并将此特征列声明为 tf.contrib.layers.sparse_column_with_integerized_feature 时遇到此错误:

 'Value passed to parameter 'x' has DataType string not in list of allowed 
values: int32, int64, float32, float64'.

非常感谢您的帮助

最佳答案

tf.contrib.layers.sparse_column_with_integerized_feature仅适用于 int32int64 值,因此它不会完全按照您想要的方式工作。

但是 tensorflow 支持数字列中的多维,因此您可以使用 tf.feature_column.numeric_column并指定您拥有的形状。请注意,tensorflow 期望所有这些形状都是相同的,因此您需要将所有值填充到一个通用形状。

冒号':'分隔符适用于多价列,here's an example如何使用 pandas 将多个值读入 DataFrame (问题是关于 XML,但同样适用于 CSV)。您可以将此数据框作为 input_fn 传递到 model.train() 函数中。

关于python - tf.contrib.layers.sparse_column_with_integerized_feature 可以处理一列中具有多个输入的分类特征吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44467241/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com