python - 词嵌入维度值实际上代表什么？-6ren

python - 词嵌入维度值实际上代表什么？

转载作者：行者123 更新时间：2023-12-02 09:39:55

31

4

我对 word2vec 和词嵌入有疑问，我已经下载了 GloVe 预训练的词嵌入(形状 40,000 x 50)并使用此函数从中提取信息:

import numpy as np
def loadGloveModel(gloveFile):
    print ("Loading Glove Model")
    f = open(gloveFile,'r')
    model = {}
    for line in f:
        splitLine = line.split()
        word = splitLine[0]
        embedding = np.array([float(val) for val in splitLine[1:]])
        model[word] = embedding
    print ("Done.",len(model)," words loaded!")
    return model

现在，如果我将此函数称为单词“python”，如下所示:

print(loadGloveModel('glove.6B.100d.txt')['python'])

它给了我 1x50 形状向量，如下所示:

[ 0.24934    0.68318   -0.044711  -1.3842    -0.0073079  0.651
 -0.33958   -0.19785   -0.33925    0.26691   -0.033062   0.15915
  0.89547    0.53999   -0.55817    0.46245    0.36722    0.1889
  0.83189    0.81421   -0.11835   -0.53463    0.24158   -0.038864
  1.1907     0.79353   -0.12308    0.6642    -0.77619   -0.45713
 -1.054     -0.20557   -0.13296    0.12239    0.88458    1.024
  0.32288    0.82105   -0.069367   0.024211  -0.51418    0.8727
  0.25759    0.91526   -0.64221    0.041159  -0.60208    0.54631
  0.66076    0.19796   -1.1393     0.79514    0.45966   -0.18463
 -0.64131   -0.24929   -0.40194   -0.50786    0.80579    0.53365
  0.52732    0.39247   -0.29884    0.009585   0.99953   -0.061279
  0.71936    0.32901   -0.052772   0.67135   -0.80251   -0.25789
  0.49615    0.48081   -0.68403   -0.012239   0.048201   0.29461
  0.20614    0.33556   -0.64167   -0.64708    0.13377   -0.12574
 -0.46382    1.3878     0.95636   -0.067869  -0.0017411  0.52965
  0.45668    0.61041   -0.11514    0.42627    0.17342   -0.7995
 -0.24502   -0.60886   -0.38469   -0.4797   ]

我需要帮助来理解输出矩阵。这些值代表什么以及生成新词的意义

最佳答案

在通常的 word2vec/GLoVe 中，各个维度坐标没有具体含义。相反，训练过程迫使单词处于有值(value)/有趣的相对位置。

所有含义均在于相对距离和相对方向，而不是专门与精确坐标轴对齐。

考虑一个经典的说明性示例:词向量能够解决类似“男人是国王，就像女人是？” - 通过在坐标空间中某个预期点附近找到工作皇后。

词向量空间的邻域包含许多一种类型的相关词(man、men、male、男孩等 - 或国王、女王、王子、皇家等.)。此外，可能有一些方向与人类的类别和程度观念非常匹配(更女性化、更君主制、更高等级等)。但这些邻域和方向通常与空间的精确轴尺寸不 1:1 相关。

此外，充满词向量的空间存在许多可能的近旋转/反射/变换，它们对于典型应用来说彼此一样好，但每个词的精确坐标完全不同。也就是说，所有预期的相对距离都是相似的——单词有“正确的”邻居，按正确的排名顺序——并且存在有用的方向模式。但每个单词中的各个单词没有全局“正确”或一致的位置 - 只是相对有用的位置。

即使在一组向量中似乎存在一些模糊的相关性 - 例如“21 维中的高值与‘男性’的概念相关 - 这很可能是该向量组的巧合，而不是可靠的关系。

(有一些替代技术试图强制将各个维度映射到更容易解释的概念 - 例如 NNSE - 但它们的使用似乎不太常见。)

关于python - 词嵌入维度值实际上代表什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49732976/

31

4

0

文章推荐： java - 如何使用泛型实现比较器？

文章推荐： clang - 为什么 LLVM 语言中有一些内在函数？

文章推荐： java - 编写一个方法来删除 Java 字符串中的元音

javascript - 实际上，渐进增强和优雅降级是一回事吗？
渐进增强和优雅降级基本是一回事吗？最佳答案不完全是。他们从不同的 Angular 解决类似的问题。 “优雅的降级”意味着你有漂亮的功能，并且可以在不支持它的浏览器中处理它不那么漂亮(但仍然需要它以
PostgreSQL 性能调整和最大连接数(实际上)
在过去的几周里，我一直在调优和处理 PostgreSQL，我将在我的下一个项目中使用它。我的规范是: DigitalOcean 8 核 16GB SSD x2(一个用于数据库，另一个用于 Web)
c++ - 实际上，负数的模数是多少？
我看过很多关于负数模的问题的答案。每一个答案都放了标准 (a/b)*b + a%b is equal to a 解释。我可以用这种方法计算任何模数，而且我知道有必要使用一个模数函数，如果它是负数，则将
java - 实际上，我会使用鸭子类型还是控制反转？
关闭。这个问题是opinion-based .它目前不接受答案。想要改进这个问题？更新问题，以便 editing this post 可以用事实和引用来回答它. 关闭 9 年前。 Improve
mercurial - 标签*实际上*是如何工作的？
The docs假设所有标签都存储在 .hgtags 中，但这里显然存在一些黑魔法。我的标签如下所示: mbayazit:~/test$ cat .hgtags 0d80b6ba4ba3b51a44
perforce - 实际上，如何删除未提交的新/添加文件的待处理更改？
我正在尝试强制删除待处理的更改列表。所有文件(20 个旧文件)都是新文件，但尚未提交/提交。所以在 p4Win 中，它们显示红色 + 十字。我无法从更改列表中删除这些文件。我该如何删除这些文件？感谢
perforce - 实际上，如何从工作区中的目录中删除文件，而这些文件不属于工作区？
如果我要删除的文件不属于工作区，那么如何从工作区的目录中删除文件？我的文件系统上有一个目录，其中包含从 perforce 获取的文件，但在某些进程运行后，它会在这些目录中创建一些新文件。是否有 p
c# - 什么时候函数内的局部变量*实际上*被分配
就是好奇这个。以下是同一功能的两个代码片段: void MyFunc1() { int i = 10; object obj = null; if(something) ret
android - ConstraintLayout 不会正确调整大小(实际上)
我对使用约束布局还很陌生，我在调整布局大小方面遇到了问题，我希望它能够响应，这样我就不必再为不同的屏幕尺寸制作 10 个布局。在布局编辑器中，一切在不同尺寸下看起来都很完美，但实际上并非如此。我做了
java - 为什么用某些编译器编译的程序可以被反编译而其他的(实际上)不能？
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
c - 有没有办法(实际上)保护对象不被修改？
如果试图修改声明为 const 的对象，const 类型限定符会导致编译器发出错误消息，但这还不够保护。例如以下程序修改声明为 const 的数组的两个元素: #include int main(v
ios - 实际上，NSAssert 的意义何在？
我不得不问这个，因为:我唯一知道的是，如果断言失败，应用程序就会崩溃。这就是为什么要使用 NSAssert 的原因吗？或者这样做还有什么好处？将 NSAssert 置于我在代码中所做的任何假设之上是否
posix - 实际上，一般使用哪些 pthreads 功能？
我正在处理我的操作系统项目的 POSIX 子系统，并且我已经达到了我想要处理 pthreads 支持的地步。但是，我不确定我应该在多大程度上实现它们。最常用的 pthreads 功能是什么？现在有什
Mercurial clone 缺少文件(实际上，只是进入了不同的分支)
这个问题不太可能对任何 future 的访客有帮助；它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于互联网的全局受众。如需帮助使这个问题更广泛适用，visit the h
java - 如何解决实际上，Mockito 中与此模拟错误的交互为零
我正在尝试运行测试类，但抛出错误实际上有零交互。 class Xtractor{ void extractValues(request,Map m1, Map m2,Map m3){
java - 如何返回扩展对象(子类)？实际上，如何返回已传递给方法的确切对象？
我有一个抽象类UIObject，如下所示: public abstract class UIObject { private final int tabOrder; public UI
Emacs Lisp 数字运算(实际上，简单的加法)
这是我尝试在 emacs lisp 中进行一些计算时得到的... (+ 2082844800. 1274511600.0) => 1209872752.0 (+ 2082844800.0 127451
swift - 实际上，如何在 Xcode 中使用一条横跨整个屏幕的垂直线分隔两个部分
我想用一条垂直线将屏幕分成两部分。垂直线应该从屏幕底部一直延伸到导航栏。如果我们使用 html/css，我只会有 2 个 div，并在右侧 div 上放置一个左边框。如果有办法在 View 的单侧放置
amazon-web-services - 实际上，如何设置Amazon AWS以使其自动缩放？
我有一个EC2实例可以正常工作数月(仍在开发中，应用程序尚未启用)，但是我只是意识到我什至不知道如何根据流量来扩大/缩小EC2实例。亚马逊提供的大量服务是压倒性的，我对此感到非常困惑。最初，虽然我
c++ - 实际上，为什么不同的编译器会计算不同的 int x =++i+++i; 值？
考虑这个代码: int i = 1; int x = ++i + ++i; 我们对编译器可能会为这段代码做些什么有一些猜测，假设它可以编译。两者 ++i返回 2 ，导致 x=4 . 一 ++i返回

首页

博学

6Ren·AI

商城

python - 词嵌入维度值实际上代表什么？