python - 多项式NB错误: "Unknown Label Type"-6ren

python - 多项式NB错误: "Unknown Label Type"

转载作者：太空狗更新时间：2023-10-29 20:11:09

28

4

我有两个 numpy 数组，X_train 和 Y_train，其中第一个维度 (700,1000) 由值 0、1、2、3、4 和 10 填充。第二个维度 (700,) 是由值“新鲜”或“烂”填充，因为我正在使用烂番茄的 API。出于某种原因，当我执行时:

nb = MultinomialNB()
nb.fit(X_train, Y_train)

我得到:

ValueError: Unknown label type

我尝试构建一对较小的数组:

print xs, '\n', ys

给予

[[0 0 0 0 1]
 [1 0 0 2 5]
 [3 2 5 5 0]
 [3 2 0 0 1]
 [1 5 1 0 0]]

['rotten' 'fresh' 'fresh' 'rotten' 'fresh']

并且多项式 NB 拟合没有给出未知标签错误。关于为什么会发生这种情况的任何想法？

我还使用 numpy.unique 检查了 X_train、Y_train 中的唯一值，似乎没有任何奇怪或打错的标签——都是“新鲜”或“腐烂”。

我生成 X_train 和 Y_train 的代码:

def make_xy(critics, vectorizer=None):
    stext = critics['quote'].tolist() # need to have a list
    if vectorizer == None:
        vectorizer = CountVectorizer(min_df=0)
    vectorizer.fit(stext)
    X = vectorizer.transform(stext).toarray() # this is X
    Y = np.asarray(critics['fresh'])
    return X[0:1000,0:1000], Y[0:1000] # this is X_train, Y_train

其中 'critics' 是从 CSV 文件 ( https://www.dropbox.com/s/0lu5oujfm483wtr/critics.csv ) 导入的 pandas 数据框，并清除了任何缺失的数据:

critics = pd.read_csv('critics.csv')
critics = critics[~critics.quote.isnull()]
critics = critics[critics.fresh != 'none']
critics = critics[critics.quote.str.len() > 0]

最佳答案

问题似乎是 y 的数据类型。看起来 numpy 没能弄清楚它是一个字符串。所以它被设置为一个通用对象。如果你改变:
Y = np.asarray(critics['fresh']) 到 Y = np.asarray(critics['fresh'], dtype="|S6") 我认为它应该工作。

关于python - 多项式NB错误: "Unknown Label Type"，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20722986/

28

4

0

文章推荐： python - 如何使 argsort 结果在相等值之间是随机的？

文章推荐： c# - 如何在 C# 中拥有配置文件的不同部分

文章推荐： c++ - 为什么 "case::LABEL:"在 g++ 中编译？

文章推荐： c# - 如何在 Web 服务中公开接口(interface)

angular - 如何在切换选项卡时调用 nebular nb-tab 中的用户定义函数
(changeTab) 对我不起作用。我想在 Angular 中切换到 Nebular Theme 中的特定选项卡时调用特定函数。最佳答案不容易提供帮助，因为您没有提供我们代码的任何示例。在这个阶
r - 使用 glmer.nb 的 nb.control 参数
我正在使用 glmer.nb 研究负二项式模型lme4 内的函数R 包。实际模型本身有些复杂，但应该(至少我相信)在统计上是合理的。我现在的问题是因为模型难以收敛并返回此警告: In checkCon
machine-learning - Scikits NB 与 NLTK NB 的性能对比
我通过绘制相应的学习曲线，比较了 NLTK 和 Scikit 中朴素贝叶斯的两种实现的性能(伯努利版本，类先验并不重要，因为我为每个类使用完全相同数量的训练示例)对于我的三类问题。 X 轴是训练数据集
java - 表达非法开始 NB
ArrayList> diskpart; List getPartition(Integer n){ List aktpart = new ArrayList<> ();
java - 分析java中的字符串的格式A^nB^n
我有一串带有 As 和 B 的字符，我需要对其进行分析以查找语言 A^nB^n。我可以使用下面的代码在大多数情况下工作，但是当有一个字母不是“A”或“B”时，它仍然可能返回 true，例如:AABAC
r - 零通胀 NB - 找不到对象 'model_count'
我正在建模一个介导的零膨胀负二项式 (ZINB) 模型。我正在遵循 O'Rourke & Vazquez (2019) 的步骤 --> https://www.sciencedirect.com/sc
python - Gaussian NB fit() 函数需要固定长度的向量
我正在尝试实现这样的高斯 NB 训练。然而，如果 X 的维度不相等(即 X 内的所有列表需要具有相同的长度)，则 gnb.fit() 会引发异常。如果我的训练样本是不同长度的向量，调用 fit() 的
java - 从 AMR-NB 文件中提取音频帧
我编写了一个算法来从 AMR 文件中提取每一帧。我认为文件的前 6 个字节是文件头，后面的信息是音频帧。每个音频帧由帧头和音频数据组成。帧头以字节为单位告知帧的大小(使用 CMR 模式表 - http
mysql - SQL - 如何忽略 $nb 结果？
我必须在网页上打印一些 SQL 的 select 请求答案。因为结果太大，所以我需要每 500 个打印 500 个。像 phpmyadmin 一样，我该如何说(使用 SQL 请求)来获取每 500
python - IPython Notebook NB 转换格式化页脚？
使用带默认选项的 NB 转换(“文章”)我没有得到带页码的页脚？我对 LaTex 一无所知，但简单看一下 tpl 文件似乎表明我应该得到页脚(也许有页码？)“书”选项提供了很好的页脚，但由于其他原因不
angular - 如何以编程方式在 Nebular nb-stepper 中设置选定的索引？
我正在试验 nb-stepper 组件，并想在我的 Angular 组件中设置 selectedIndex。刷新我的事件后在 [(selectedIndex)] 上指定双向绑定(bind)时，nb-s
r - glm.nb 与 sqrt 链接
我正在尝试使用 sqrt 链接拟合 Negbin 模型。不幸的是，我似乎必须指定起始值。有人熟悉在运行 glm.nb 时设置起始值吗？命令(包 MASS)？当我不使用起始值时，我收到一条错误消息:
netbeans - 在用户目录中创建新文件(在 NB 平台上使用 InstalledFileLocator)
如何在 NetBeans 平台应用程序的用户目录中创建新文件？我用了: System.getProperty("netbeans.user", "user.home") + "/myfile");
更改值时，Angular nb-radio(更改)不会触发
星云 checkbox.component.ts不开火 (change)值改变时的事件。 checkbox.component.ts应该有更改事件 {{t}} 最佳答案星云 nb-radio
java - 如何将字符串数组设置为等于另一个字符串(Java)(NB : I am using I/O)?
我有一个程序可以打开项目文件夹中的 .txt 文件并读取其中的行。我知道文件读取有效，所以它不是 I/O 问题(或 Swing ，因为我也在使用它)，但是当我设置 nim (我的变量)= anArra
java - 如何从另一个java应用程序中运行iReport-nb 3.x.x？
我想开始使用 iReport(netbeans 版本)并替换旧的经典 iReport 3.0.x。看起来经典的 iReport 不会再得到改进，并且在某个时候会被放弃。问题是我需要从另一个java应
javascript - Google SignOut 过程中的错误未捕获错误 : nb JS
为了重构我的代码，我编写了如下的 google SignOut 函数 function googleSignOut() { if (typeof module_google_login ==
javascript - 为什么 [.\n]+ 不匹配字符串 'a\nb' ？
这是我的 js 正则表达式测试。 'AAa\nbBB'.match(/AA[.\n]+BB/);//failed match 我认为[.\n]+可以匹配任何字符。我错了吗？最佳答案该点与 char
css - 没有名为 nb-install 的 mixin
我正在使用 angular5，在执行 npm start 或 serve 时出现“No mixin named nb-install”错误 Module build failed: undefined
c - 在 C 中写入 Nb 空白字符
我只是想知道如何在 C 中编写一定数量的空白字符。例如，如果我想在文件描述符中写入 size 空白字符，我会这样写: int fd = open(filename, O_RDWR|O_CREA

首页

博学

6Ren·AI

商城

python - 多项式NB错误: "Unknown Label Type"