gpt4 book ai didi

tensorflow - tensorflow中跑word2vec模型时如何按句分隔?

转载 作者:行者123 更新时间:2023-12-04 01:13:05 25 4
gpt4 key购买 nike

在gensim word2vec中,输入可以是句子列表。然而,在 tensorflow word2vec 中,输入是一个单词列表(将句子连接在一起)。在构造{目标词,上下文词}对时有没有办法将句子分开?我正在使用以下代码: https://github.com/tensorflow/tensorflow/blob/r0.8/tensorflow/models/embedding/word2vec.py

最佳答案

听起来您不希望句子末尾的单词与下一句开头的单词相关联(成为同一本地上下文窗口的一部分)。如果是这样,有几种不同的方法可以实现这一点。

如果你不想对word2vec示例代码进行任何代码修改,最简单的方法是在每个句子的末尾和开头添加几个间隔词。您需要添加与 window_size 参数一样多的单词。默认的 window_size5

如果例句是:
狗跳过栅栏
您需要在开头和结尾添加间隔符(此处为 XYZ):
XYZ XYZ XYZ XYZ XYZ 狗跳过栅栏 XYZ XYZ XYZ XYZ XYZ

关于tensorflow - tensorflow中跑word2vec模型时如何按句分隔?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37053011/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com