gpt4 book ai didi

python - Tensorflow Bow Encoder 解释

转载 作者:行者123 更新时间:2023-11-28 19:08:51 25 4
gpt4 key购买 nike

有人可以向我解释 Tensorflow BoW 编码器正在做什么/返回什么吗?我希望得到每个文档的字数向量(就像在 sklearn 中一样),但是,显然它正在做一些更花哨的事情。

在这个例子中:

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/learn/text_classification.py

features = encoders.bow_encoder(
features, vocab_size=n_words, embed_dim=EMBEDDING_SIZE)

传递了一个“embed_dim”,我也不明白这是在 BoW 编码的上下文中做了什么。遗憾的是,文档不是很有帮助。我可以肯定地尝试通过 Tensorflow 代码工作,但是,我将不胜感激高级解释。

最佳答案

在经典的 BOW 模型中,每个单词都由一个 ID(稀疏向量)表示。 bow_encoder 将这些稀疏向量映射到另一个层,其大小由“embed_dim”指定。 bow_encoder 用于学习单词或文本的密集向量表示(例如在 word2vec 模型中)。

来自关于 bow_encoder 的 tensorflow 文档:“通过平均嵌入将符号序列映射到每个示例的向量。”

因此:如果 bow_encoder 的输入是单个单词,它只是映射到嵌入层。虽然一个句子(或文本)是逐词映射的,但最终的嵌入向量是平均的。

关于python - Tensorflow Bow Encoder 解释,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43033038/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com