gpt4 book ai didi

python - hmmlearn中的HMM模型是如何识别隐藏状态的

转载 作者:太空狗 更新时间:2023-10-29 18:03:34 26 4
gpt4 key购买 nike

我是隐马尔可夫模型的新手,为了试验它,我正在研究晴天/雨天/雾天的情景,这是基于对一个人是否带伞的观察,在 hmmlearn package 的帮助下在 Python 中。我测试中使用的数据来自 this page (“测试 1”的 testoutput 文件)。

我创建了下面显示的简单代码以从测试数据中拟合无监督 HMM,然后将预测与预期输出进行比较。结果看起来非常好(10 个正确预测中有 7 个)。

我的问题是:我应该如何知道模型处理的隐藏状态到问题域中真实状态的映射? (换句话说,我如何将响应与我的问题域的所需状态相关联?)

这可能是一个非常幼稚的问题,但如果模型受到监督,我会理解映射是我在为 fit 方法提供 Y 值时给出的...但我根本无法弄清楚它是如何工作的在这种情况下。

代码:

import numpy as np
from hmmlearn import hmm

# Load the data from a CSV file
data = np.genfromtxt('training-data.csv', skip_header=1, delimiter=',',
dtype=str)

# Hot encode the 'yes' and 'no' categories of the observation
# (i.e. seeing or not an umbrella)
x = np.array([[1, 0] if i == 'yes' else [0, 1] for i in data[:, 1]])

# Fit the HMM from the data expecting 3 hidden states (the weather on the day:
# sunny, rainy or foggy)
model = hmm.GaussianHMM(n_components=3, n_iter=100, verbose=True)
model.fit(x, [len(x)])

# Test the model
test = ['no', 'no', 'no', 'yes', 'no', 'no', 'yes', 'yes', 'no', 'yes']
x_test = np.array([[1, 0] if i == 'yes' else [0, 1] for i in test])
y_test = ['foggy', 'foggy', 'foggy', 'rainy', 'sunny', 'foggy', 'rainy', 'rainy', 'foggy', 'rainy']

y_pred = model.predict(x_test)

mp = {0: 'sunny', 1: 'rainy', 2: 'foggy'} # THIS IS MY ASSUMPTION

print('\n\n\n')

print('Expected:')
print(y_test)
print('Predicted:')
print([mp[i] for i in y_pred])

结果:

Expected:
['foggy', 'foggy', 'foggy', 'rainy', 'sunny', 'foggy', 'rainy', 'rainy', 'foggy', 'rainy']
Predicted:
['foggy', 'foggy', 'sunny', 'rainy', 'foggy', 'sunny', 'rainy', 'rainy', 'foggy', 'rainy']

最佳答案

My question is: how am I supposed to know the mapping of the hidden states handled by the model to the real states in the problem domain? (in other words, how do I relate the responses to the desired states of my problem domain?)

基本上你不能。您能够手工制作此映射(或者甚至它本来就存在)这一事实只是巧合,因为问题极其简单。

HMM(在这种学习场景中)试图找到最有可能的(预定义数量的)隐藏状态序列,但与任何其他无法保证匹配任务的无监督学习一样手。在给定约束条件(马尔可夫假设、隐藏状态的数量、提供的观察结果)的情况下,它只是尽可能地模拟现实——它不会神奇地检测出人们问的实际问题是什么(比如这里——天气序列),而只是简单地尝试解决它自己的内部优化问题——这是最有可能的任意定义隐藏状态序列,这样在马尔可夫假设(独立于旧历史)下,所提供的观察结果很可能出现。

一般来说,您将无法如此轻松地解释这些状态,这里的问题非常简单,只需使用上面列出的假设 - 这种(天气状态)几乎是最有可能被建模的事物。在其他问题中——它可以捕获任何有意义的东西。

如前所述 - 这不是 HMM 属性,而是任何无监督学习技术 - 当您对数据进行聚类时,您只会发现一些数据分区,这可能与您正在寻找的内容有某种关系 -或者没有。同样在这里 - HMM 会找到一些动力学模型,但它可能与您所追求的完全不同。如果你知道你在寻找什么——你应该使用监督学习,这就是它的定义。无监督学习是寻找一些结构(此处为动态),而不是特定结构。

关于python - hmmlearn中的HMM模型是如何识别隐藏状态的,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41674955/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com