gpt4 book ai didi

变量值列表的 Tensorflow 特征列

转载 作者:行者123 更新时间:2023-11-30 08:23:03 24 4
gpt4 key购买 nike

从 TensorFlow 文档中可以清楚地了解如何使用 tf.feature_column.categorical_column_with_vocabulary_list创建一个特征列,它将一些字符串作为输入并输出一个单热向量。例如

vocabulary_feature_column =
tf.feature_column.categorical_column_with_vocabulary_list(
key="vocab_feature",
vocabulary_list=["kitchenware", "electronics", "sports"])

比方说"kitchenware"映射到[1,0,0]"electronics"映射到[0,1,0] 。我的问题与将字符串列表作为一项功能有关。例如,如果特征值为 ["kitchenware","electronics"]那么所需的输出将是 [1,1,0] 。输入列表长度不固定,但输出维度固定。

用例是一个直接的词袋类型模型(显然具有更大的词汇列表!)。

实现这个的正确方法是什么?

最佳答案

以下是如何向指标列提供数据的示例:

features = {'letter': [['A','A'], ['C','D'], ['E','F'], ['G','A'], ['X','R']]}

letter_feature = tf.feature_column.categorical_column_with_vocabulary_list(
"letter", ["A", "B", "C"], dtype=tf.string)

indicator = tf.feature_column.indicator_column(letter_feature)
tensor = tf.feature_column.input_layer(features, [indicator])

with tf.Session() as session:
session.run(tf.global_variables_initializer())
session.run(tf.tables_initializer())
print(session.run([tensor]))

哪些输出:

[array([[2., 0., 0.],
[0., 0., 1.],
[0., 0., 0.],
[1., 0., 0.],
[0., 0., 0.]], dtype=float32)]

关于变量值列表的 Tensorflow 特征列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48697799/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com