- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设您有一个单词 queen
的词向量。对于任何实际值,其标量倍数将是 x = queen + queen
、 y = queen + queen + queen
和 n * queen
n (因此我们还考虑 n 的非整数值,例如 0.83 * queen
)。
根据最相似单词的投影权重向量的简单均值与向量 queen + queen 之间的余弦相似度,将 x 视为与向量 queen + queen 最相似的单词。
用同样的方法将y视为与向量queen + queen + queen最相似的词。
那么单词x
、y
和queen
之间的语义关系是什么?我知道这些向量在向量内的维度值之间都具有相同的比率,但我很难弄清楚如何从单词含义的角度来阅读它。
我的直觉告诉我,我会在另一个上下文中得到一些东西,该东西在该上下文中的位置类似于女王。例如,女王的“财富”可能明显大于女王的“美貌”。所以我会在另一个上下文中得到另一个词,它与“女王”具有相同的财富/美丽平衡。
假设我将女王乘以 n,我将从皇家头衔(女王、国王、公主...)转移到福布斯排行榜(杰夫·贝佐斯、比尔·盖茨、沃伦·巴菲特...)。
女王 * n = 福布斯排行榜上与女王具有相同财富/美丽平衡的人(非常富有,但不是很漂亮)
公主 * n = 福布斯排行榜上与公主拥有相同财富/美丽平衡的人(中等富裕,但非常漂亮)
但这只是一个疯狂的理论,我不知道如何系统地证明这是真的。
最佳答案
与 wv['queen']
最余弦相似的单词将与与 n * wv['queen'] 最余弦相似的单词完全相同
code>,对于任何 n
,因为余弦相似度不受矢量幅度的影响。所以,你的假设是错误的。
如果您要在原始(非单位标准化)单词向量上使用欧几里德距离而不是余弦相似度,您可能会发现一些其他有趣的关系......但这不是使用/比较单词的典型方法-向量,所以你必须进行实验,我对你会发现什么或者它是否有用没有期望。
一般来说,对于具有单一狭义的单词(它们出现的所有上下文都非常相似),原始的非单位标准化单词向量往往具有更高的量级,而具有多种含义和不同上下文的单词往往具有较小的幅度。但我不确定你是否可以完全依赖这一点。一旦词向量被归一化为单位长度——因此所有词都在同一个“单位球”上——那么最近邻的排序将通过余弦距离或欧几里得-距离(即使每个等级的距离/相似度数字的大小不相同或不成比例)。
关于machine-learning - word2vec 中互为标量倍数的词向量之间期望的语义关系是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51610905/
所以这是我的情况。我有几个数字,我想四舍五入到最接近和最小的 10 的倍数。 例如,介于51到59之间的值应四舍五入到50。 Input = 59 = >Respose = 50 Input = 51
我尝试在 select2 多重选择中实现以下场景。 用户选择一些选项 用户在选择中选择“无必需程序” Select 会清除所有选定的值 Select 有一个占位符,其中包含以下文本:“无必需功能” 这
我正在寻找一种方法将数字四舍五入为最接近的 250 的倍数。例如,如果我有以下 JS: var containerHeight = $("#container").height(); ...我们假设“
大家好,我是 AngularJS 的新手,我在调用多个 http.get 时遇到问题。 $scope.countries 正在从城市获取值(value)。发生了什么事?如何调用多个http.get?
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: What does the ** operator do in Python? 以下 python 代码中的
我想用 scss 做点什么。我基本上想要它,所以我可以为每 5px 留出任何余量。因此,例如我可以写 m10 m15 m20 m25 等......它会创建 margin:10px;边距:15px;等
我正在用 C Sharp 创建一架钢琴,目前我有键盘键来播放声音。例如,键 A 播放音符 C。我遇到的问题是我想同时按下多个键并发出声音。显然我不想将所有组合都放在 keyDown 类中,因为我将不得
我仍在寻找Rails优雅的多文件上传方式。 我刚刚了解了“输入类型=”文件”多个” Rails支持吗?有什么例子吗?在Rails中如何实现将多张照片上传到相册模板的技巧? 谢谢 最佳答案 您需要的是更
我有这样的代码,可以创建多个 D3 donut 倍数。 body { font: 10px sans-serif; } svg { padding: 10px 0 0 10px; } .
如何在 numpy 中将数字取整到最接近 0.2 的倍数? 例如,我有这个: 0.2 * np.floor(xi / 0.2) 它在大多数情况下都有效,例如 >>> xi = 9.4 >>> 0.2
这个问题在这里已经有了答案: Rounding numbers to specific multiples [duplicate] (1 个回答) 关闭 6 年前。 我有一个花车。我想将它舍入到最接
我意识到这不是一个很好的标题,所以我会尝试更彻底地解释。 基本上,我有一个只有少量变化的 double 值,称为 clusterSize。然后,我有第二个 double 值,即 map 上的纬度或经度
我在 Canvas 上绘制了一个网格,当用户点击网格时,我正在绘制一个矩形。我想始终在用户单击的网格单元格顶部绘制矩形。所以我需要向下舍入到最接近的 X,在我的例子中,是 40 的倍数。 一些例子..
如何舍入为某些基本浮点单位的偶数倍(例如 0.0005f) float example_input = 2.718281828459f; float unit = 0.0005f; 使得输出的形式为2
我是 Java 编程的新手。我想将价格四舍五入到最接近的小数点后两位。 例如 38.82 变成 38.80 38.87 变成 38.90 38.85 保持不变。我做了例如1 和例如2 但结果只有小数点
我在 float 中给出了值和步数,例如: double step = 0.4; double value = 47.7121; 对于我给出的每个值和步骤对,我需要返回步骤的最接近的可表示 float
我正在尝试在我的一台服务器上运行 Drupal 8,但是在浏览器中安装 Drupal 期间,它为我提供了与运行 php -v 时不同的 PHP 版本 (7.0.23) > 在命令行 (7.1.12)
我需要将数字四舍五入到最接近的 0.11 倍数或四舍五入整数 示例: 0.99 turns to 1.00 0.87 turns to 0.88 0.59 turns to 0.55 54.01 tu
我有一个从公式计算的 double 列表。例如,其中一个 double 是 88.32547。我想将它们转换为最接近的 10 的整数倍,并将它们放入另一个变量中。 在示例中,double a = 88
我正在尝试合并 this multiples example在 this example 中看到焦点鼠标悬停 + 十字准线功能.我预期的 y 大小的十字准线一直在 x 线上射击。 See workin
我是一名优秀的程序员,十分优秀!