gpt4 book ai didi

algorithm - 如何使用非标量输入数据/属性实现 Kohonen 映射 (SOM)

转载 作者:塔克拉玛干 更新时间:2023-11-03 05:23:38 26 4
gpt4 key购买 nike

一般来说,仅使用实值向量的 Kohonen 映射/SOM 算法的实现是一项相对微不足道的任务。由于“权重更新”阶段,我想知道如何为文本字符串等非实值(即非标量)属性实现这样的算法。

假设有一组数据包含不同长度的单词、含义类别以及浪漫程度,例如 rose(非常浪漫)、flower(浪漫)、plant(浪漫取决于上下文)、factory (浪漫只为 Steam 朋克)。我正在弥补,所以请忽略细节。 (编辑:是的,浪漫度可以表示为标量值;我的问题实际上与部分无关。)

可以打乱单词甚至字母以在 map 上创建原型(prototype),然后使用 Levenshtein 距离来找到最佳匹配单元,我明白了。但是如何更新 BMU 及其邻域以选择目标向量?

其他示例可能是嵌入一维(标量)数据流中的绘画(例如按颜色、主题、时代……)或感知形状(例如三角形、锯齿……)。

最佳答案

难道浪漫的程度只是一个数字吗? “这朵玫瑰是0.9的浪漫”。然后在 SOM 中为您的 0.9 找到正确的位置,这就是您的玫瑰应该放置的位置。如果你有多个维度,它基本上是一个向量,但仍然是一个数字向量,而不是一个字符串,因此更容易更新

关于algorithm - 如何使用非标量输入数据/属性实现 Kohonen 映射 (SOM),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23169604/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com