gpt4 book ai didi

machine-learning - 条件随机场特征函数

转载 作者:行者123 更新时间:2023-11-30 09:38:24 26 4
gpt4 key购买 nike

我一直在阅读一些关于 CRF 的论文,并且对特征函数有些困惑。一元(节点)和二元(边缘)特征 f 通常具有以下形式

f(yc, xc) = 1{yc=y ̃c}fg(xc)。

其中 {.} 是指示函数,如果所包含的条件为 true,则计算结果为 1,否则计算结果为 0。 fg 是数据 xc 的函数,它从数据中提取有用的属性(特征)。

现在在我看来,要创建 CRF 特征,必须知道真实标签 (yc)。这对于训练来说是正确的,但对于测试阶段,真实的类标签是未知的(因为我们试图确定它们最可能的值)。

我错过了什么吗?如何正确实现?

最佳答案

CRF 的想法是为每个标签设置分配一个分数。因此,理论上,您要做的就是计算所有可能的标签分配的分数,然后哪个标签获得最大分数就是 CRF 预测/输出的内容。只有当 CRF 对不同的标签分配给出不同的分数时,这才有意义。当您这样想时,很明显标签必须参与到特征函数中才能发挥作用。

假设 CRF 的对数概率函数是 F(x,y)。因此,它为数据样本 x 和标签 y 的每个组合分配一个数字。因此,当您获得新的数据样本时,测试期间的预测标签就是 argmax_y F(new_x, y)。也就是说,您找到使 F(new_x,y) 最大的 y 值,这就是预测的标签。

关于machine-learning - 条件随机场特征函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18299664/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com