- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
使用 sklearn 的 StratifiedKFold 函数,有人可以帮助我理解这里的错误吗?
我的猜测是它与我输入的标签数组有关,我注意到当我打印它们时(本例中的前 16 个)索引从 0 到 15,但是在我上面打印了一个额外的 0没想到。也许我只是一个 python 菜鸟,但这看起来很奇怪。
有人看到这里的错误吗?
文档:http://scikit-learn.org...StratifiedKFold.html
代码:
import nltk
import sklearn
print('The nltk version is {}.'.format(nltk.__version__))
print('The scikit-learn version is {}.'.format(sklearn.__version__))
print type(skew_gendata_targets.values), skew_gendata_targets.values.shape
print skew_gendata_targets.head(16)
skew_sfold10 = cross_validation.StratifiedKFold(skew_gendata_targets.values, n_folds=10, shuffle=True, random_state=20160121)
结果
The nltk version is 3.1.
The scikit-learn version is 0.17.
<type 'numpy.ndarray'> (500L, 1L)
0
0 0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
10 0
11 0
12 0
13 0
14 1
15 0
---------------------------------------------------------------------------
IndexError Traceback (most recent call last)
<ipython-input-373-653b6010b806> in <module>()
8 print skew_gendata_targets.head(16)
9
---> 10 skew_sfold10 = cross_validation.StratifiedKFold(skew_gendata_targets.values, n_folds=10, shuffle=True, random_state=20160121)
11
12 #print '\nSkewed Generated Dataset (', len(skew_gendata_data), ')'
d:\Program Files\Anaconda2\lib\site-packages\sklearn\cross_validation.pyc in __init__(self, y, n_folds, shuffle, random_state)
531 for test_fold_idx, per_label_splits in enumerate(zip(*per_label_cvs)):
532 for label, (_, test_split) in zip(unique_labels, per_label_splits):
--> 533 label_test_folds = test_folds[y == label]
534 # the test split can be too big because we used
535 # KFold(max(c, self.n_folds), self.n_folds) instead of
IndexError: too many indices for array
最佳答案
检查 skew_gendata_targets.values
的形状。您会看到它不是 StratifiedKFold 期望的一维数组(形状 (500,) ),而是 (500,1) 数组。 SKlearn 将它们分开处理,而不是强制它们相同。让我知道是否有帮助
关于python - 分层KFold : IndexError: too many indices for array,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35022463/
我在cmd中发起了焰火,并在下面进行了表演,以提高我的技能。。当我执行a.take(1)时,我得到“_ickle.PicklingError:无法序列化对象:IndexError:tuple inde
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题?通过 editing this post 添加详细信息并澄清问题. 1年前关闭。 Improve this
如果我测试以下“空”条件,则会得到一个IndexError,指出字符串索引超出范围。这是为什么?如果用户输入为空,我希望脚本打印“空”。 pyg = 'ay' original = raw_input
我在 occurence[j] = 0 上收到错误消息.我真的不明白我的代码中这个错误的起源,因为它的长度是 dna,因为我在代码的顶部附加了 len(dna)零,然后我将一些值分配给同一个列表 oc
我正在阅读python上的视频帧,并且试图找到每个帧索引的RGB。我需要检测LED(将阈值设置为开/关-红色/黑色),但是我遇到了索引编制问题。 我需要访问图像左下角的RGB值。 # Check if
你能告诉我为什么我必须在 try/except 语句中包含这个 if 吗?当我使用列表调用函数时,此方法会引发 IndexError ,其中最后一个元素与列表中的其他元素相同。当最后一个元素在列表中仅
我需要帮助对我的键值对进行排序。我的输出位于此网址 http://pastebin.com/ckKAtP5y 中。然而,我一直在努力做的是。 { "courses": [ {
我知道索引会超过该组最后一个成员的索引,但如何使该功能正常工作? 无论如何,该函数的目的是检查列表中的所有成员是否相同。我对另一个函数有同样的问题,该函数旨在检查列表是否按顺序排列。它适用于其他所有内
请考虑以下代码吗? start_list = [5, 3, 1, 2, 4] square_list = [] for i in start_list: square_list.append(
我正在尝试找出它抛出该错误的原因。元组的长度应该是 4,确实是。有什么提示、想法吗? 此代码适用于我正在为 Udacity 编程入门 nano 学位开展的瑞士风格项目。 相关代码Python代码来自t
已更新,看底! 我卡住了!我收到一个 IndexError: list index out of range 错误。 def makeInverseIndex(strlist): numStr
我想我是在问一个新手问题,但今天花了太多时间寻找答案。在使用 np.genfromtxt 保存和重新加载后天真地尝试对 numpy 数组执行相同的切片操作时,我收到了 IndexError: too
我一直在做一个井字游戏的程序,需要两个玩家轮流输入棋盘坐标,比如 (r1,c1)->(r2,c2)-> (r3,c3)-> …,其中 r 是行,c 是列,棋盘看起来像 0 1 2 3 4 5 6 7
一些背景知识: 我正在编写一个基于单词的小型迷宫游戏,从一个由 X、O 和 F 组成的简单迷宫开始。 我的迷宫是代表迷宫本身的列表列表,其中 X 是一堵墙,O 是一个开放点,F 是终点线。 我正在尝试
s="(8+(2+4))" def checker(n): if len(n) == 0: return True if n[0].isdigit==True: if n[1].isd
我在图表上搜索单词的代码如下: size = len(word) height = len(diagram) width = len(diagram[0]) for i in range(0, hei
我有 Python 代码在列表中搜索字符串并将相应的参数存储到变量。 “X”下方的列表由单引号中的逗号分隔,这是我的实际逻辑 map1 = str(val).split('MAP:')[1].spli
这个问题在这里已经有了答案: How to remove items from a list while iterating? (25 个答案) 关闭 6 年前。 我是 Python 初学者。之前学
a = [1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89] for i in a: print(a[i]) IndexError: list index out of
在我使用 python 实现的合并排序中,运行时发生错误 IndexError: list assignment index out of range 这是代码: #merge def merge(a
我是一名优秀的程序员,十分优秀!