- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有两个 numpy 数组,X_train 和 Y_train,其中第一个维度 (700,1000) 由值 0、1、2、3、4 和 10 填充。第二个维度 (700,) 是由值“新鲜”或“烂”填充,因为我正在使用烂番茄的 API。出于某种原因,当我执行时:
nb = MultinomialNB()
nb.fit(X_train, Y_train)
我得到:
ValueError: Unknown label type
我尝试构建一对较小的数组:
print xs, '\n', ys
给予
[[0 0 0 0 1]
[1 0 0 2 5]
[3 2 5 5 0]
[3 2 0 0 1]
[1 5 1 0 0]]
['rotten' 'fresh' 'fresh' 'rotten' 'fresh']
并且多项式 NB 拟合没有给出未知标签错误。关于为什么会发生这种情况的任何想法?
我还使用 numpy.unique 检查了 X_train、Y_train 中的唯一值,似乎没有任何奇怪或打错的标签——都是“新鲜”或“腐烂”。
我生成 X_train 和 Y_train 的代码:
def make_xy(critics, vectorizer=None):
stext = critics['quote'].tolist() # need to have a list
if vectorizer == None:
vectorizer = CountVectorizer(min_df=0)
vectorizer.fit(stext)
X = vectorizer.transform(stext).toarray() # this is X
Y = np.asarray(critics['fresh'])
return X[0:1000,0:1000], Y[0:1000] # this is X_train, Y_train
其中 'critics' 是从 CSV 文件 ( https://www.dropbox.com/s/0lu5oujfm483wtr/critics.csv ) 导入的 pandas 数据框,并清除了任何缺失的数据:
critics = pd.read_csv('critics.csv')
critics = critics[~critics.quote.isnull()]
critics = critics[critics.fresh != 'none']
critics = critics[critics.quote.str.len() > 0]
最佳答案
问题似乎是 y 的数据类型。看起来 numpy 没能弄清楚它是一个字符串。所以它被设置为一个通用对象。如果你改变:
Y = np.asarray(critics['fresh'])
到 Y = np.asarray(critics['fresh'], dtype="|S6")
我认为它应该工作。
关于python - 多项式NB错误: "Unknown Label Type",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20722986/
(changeTab) 对我不起作用。我想在 Angular 中切换到 Nebular Theme 中的特定选项卡时调用特定函数。 最佳答案 不容易提供帮助,因为您没有提供我们代码的任何示例。在这个阶
我正在使用 glmer.nb 研究负二项式模型lme4 内的函数R 包。实际模型本身有些复杂,但应该(至少我相信)在统计上是合理的。我现在的问题是因为模型难以收敛并返回此警告: In checkCon
我通过绘制相应的学习曲线,比较了 NLTK 和 Scikit 中朴素贝叶斯的两种实现的性能(伯努利版本,类先验并不重要,因为我为每个类使用完全相同数量的训练示例)对于我的三类问题。 X 轴是训练数据集
ArrayList> diskpart; List getPartition(Integer n){ List aktpart = new ArrayList<> ();
我有一串带有 As 和 B 的字符,我需要对其进行分析以查找语言 A^nB^n。我可以使用下面的代码在大多数情况下工作,但是当有一个字母不是“A”或“B”时,它仍然可能返回 true,例如:AABAC
我正在建模一个介导的零膨胀负二项式 (ZINB) 模型。我正在遵循 O'Rourke & Vazquez (2019) 的步骤 --> https://www.sciencedirect.com/sc
我正在尝试实现这样的高斯 NB 训练。然而,如果 X 的维度不相等(即 X 内的所有列表需要具有相同的长度),则 gnb.fit() 会引发异常。如果我的训练样本是不同长度的向量,调用 fit() 的
我编写了一个算法来从 AMR 文件中提取每一帧。我认为文件的前 6 个字节是文件头,后面的信息是音频帧。每个音频帧由帧头和音频数据组成。帧头以字节为单位告知帧的大小(使用 CMR 模式表 - http
我必须在网页上打印一些 SQL 的 select 请求答案。 因为结果太大,所以我需要每 500 个打印 500 个。 像 phpmyadmin 一样,我该如何说(使用 SQL 请求)来获取每 500
使用带默认选项的 NB 转换(“文章”)我没有得到带页码的页脚?我对 LaTex 一无所知,但简单看一下 tpl 文件似乎表明我应该得到页脚(也许有页码?)“书”选项提供了很好的页脚,但由于其他原因不
我正在试验 nb-stepper 组件,并想在我的 Angular 组件中设置 selectedIndex。刷新我的事件后在 [(selectedIndex)] 上指定双向绑定(bind)时,nb-s
我正在尝试使用 sqrt 链接拟合 Negbin 模型。不幸的是,我似乎必须指定起始值。有人熟悉在运行 glm.nb 时设置起始值吗?命令(包 MASS)? 当我不使用起始值时,我收到一条错误消息:
如何在 NetBeans 平台应用程序的用户目录中创建新文件? 我用了: System.getProperty("netbeans.user", "user.home") + "/myfile");
星云 checkbox.component.ts不开火 (change)值改变时的事件。 checkbox.component.ts应该有更改事件 {{t}} 最佳答案 星云 nb-radio
我有一个程序可以打开项目文件夹中的 .txt 文件并读取其中的行。我知道文件读取有效,所以它不是 I/O 问题(或 Swing ,因为我也在使用它),但是当我设置 nim (我的变量)= anArra
我想开始使用 iReport(netbeans 版本)并替换旧的经典 iReport 3.0.x。看起来经典的 iReport 不会再得到改进,并且在某个时候会被放弃。 问题是我需要从另一个java应
为了重构我的代码,我编写了如下的 google SignOut 函数 function googleSignOut() { if (typeof module_google_login ==
这是我的 js 正则表达式测试。 'AAa\nbBB'.match(/AA[.\n]+BB/);//failed match 我认为[.\n]+可以匹配任何字符。我错了吗? 最佳答案 该点与 char
我正在使用 angular5,在执行 npm start 或 serve 时出现“No mixin named nb-install”错误 Module build failed: undefined
我只是想知道如何在 C 中编写一定数量的空白字符。例如,如果我想在文件描述符中写入 size 空白字符,我会这样写: int fd = open(filename, O_RDWR|O_CREA
我是一名优秀的程序员,十分优秀!