gpt4 book ai didi

python - 在 Python 中使用 hmmlearn 学习字符序列

转载 作者:太空宇宙 更新时间:2023-11-03 14:54:39 25 4
gpt4 key购买 nike

这是我的问题,我正在尝试使用 hmmlearn 教授隐马尔可夫模型。我是这门语言的新手,我很难理解列表和数组之间的差异。这是我的代码:

from hmmlearn import hmm
from babel import lists
import numpy as np
import unidecode as u
from numpy import char

l = []
data = []
gods_egypt = ["Amon","Anat","Anouket","Anubis","Apis","Atoum","Bastet","Bès","Gheb","Hâpy","Harmachis","Hathor","Heh","Héket","Horus","Isis","Ka","Khepri","Khonsou","Khnoum","Maât","Meresger","Mout","Nefertoum","Neith","Nekhbet","Nephtys","Nout","Onouris","Osiris","Ouadjet","Oupaout","Ptah","Rê","Rechef","Renenoutet","Satet","Sebek","Sekhmet","Selkis","Seth","Shou","Sokaris","Tatenen","Tefnout","Thot","Thouéris"]
for i in range(0, len(gods_egypt)):
data.append([])
for j in range(0, len(gods_egypt[i])):
data[i].append([u.unidecode(gods_egypt[i][j].lower())])
l.append(len(data[i]))
data = np.asarray(data).reshape(-1,1)
model = hmm.MultinomialHMM(20, verbose=True)
model = model.fit(data, l)

以及结果输出

Traceback (most recent call last):
File "~~~\HMM_test.py", line 17, in <module>
model = model.fit(data, l)
File "~~~\Python\Python36\site-packages\hmmlearn\base.py", line 420, in fit
X = check_array(X)
File "~~~\Python36-32\lib\site-packages\sklearn\utils\validation.py", line 402, in check_array
array = np.array(array, dtype=dtype, order=order, copy=copy)
ValueError: setting an array element with a sequence.

我在ValueError: setting an array element with a sequence看到过这可能是数组长度不同的问题,但我不知道如何解决。

有什么建议吗?

最佳答案

错误本身来自于 model.fit()需要一个由数值数组组成的数组。现在您的输入data是字符串列表列表的数组的数组。这就是引发错误的原因,因为该函数发现 array element它正在期待is a sequence即(字符串列表)列表。

但是,即使修复了列表问题,还会出现另一个问题:学习 HMM 意味着通过一组方程计算数值量。学习 HMM 的输入数据应该是数字,而不是一组字母。 (除非 hmmlearn 对于我不知道的字符有一个非常特殊的选项。)

如果你想使用 HMM,你需要首先将字母转换为数字。

我不知道你的最终目标是什么。 HMM 旨在对数据进行建模以用于生成或分类目的(如果训练了多个 HMM)。一旦你根据组成单词的字母建立了训练有素的模型,你打算做什么?

至于向不同函数提供数据的格式,我建议你看一下documentation 。它包括该库的使用教程。

关于python - 在 Python 中使用 hmmlearn 学习字符序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45680809/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com