- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
所以我对机器学习和 Python 都很陌生,但已经设法对我的数据进行分类,并使用以下代码使用各种分类器打印混淆矩阵:
def classify_data(df, feature_cols, file):
nbr_folds = 5
attributes = df.loc[:, feature_cols] # Also known as x
class_label = df['task'] # Class label, also known as y.
file.write("\nFeatures used: ")
for feature in feature_cols:
file.write(feature + ",")
print("Features used", feature_cols)
print("MLP")
file.write("MLP")
mlp = MLPClassifier(solver='lbfgs', alpha=1e-5, hidden_layer_sizes=(5, 2), random_state=1)
class_label_predicted = cross_val_predict(mlp, attributes, class_label, cv=nbr_folds)
conf_mat = confusion_matrix(class_label, class_label_predicted)
print(conf_mat)
accuracy = accuracy_score(class_label, class_label_predicted)
print("\nRows classified: " + str(len(class_label_predicted)))
print("\nAccuracy: {0:.3f}%\n".format(accuracy * 100))
file.write("\nClassifier settings:" + str(mlp) + "\n")
file.write("\nRows classified: " + str(len(class_label_predicted)))
file.write("\nAccuracy: {0:.3f}%\n".format(accuracy * 100))
file.writelines('\t'.join(str(j) for j in i) + '\n' for i in conf_mat)
print("RandomForest")
file.write("\nRandomForest")
#sv = svm.SVC(kernel="linear")
clf = RandomForestClassifier(max_depth=2, random_state=0)
class_label_predicted = cross_val_predict(clf, attributes, class_label, cv=nbr_folds)
conf_mat = confusion_matrix(class_label, class_label_predicted)
print(conf_mat)
accuracy = accuracy_score(class_label, class_label_predicted)
print("Rows classified: " + str(len(class_label_predicted)))
print("Accuracy: {0:.3f}%\n".format(accuracy * 100))
file.write("\nClassifier settings:" + str(clf) + "\n")
file.write("\nRows classified: " + str(len(class_label_predicted)))
file.write("\nAccuracy: {0:.3f}%\n".format(accuracy * 100))
file.writelines('\t'.join(str(j) for j in i) + '\n' for i in conf_mat)
但是,我开始怀疑我是否在这里做错了什么,因为混淆矩阵几乎总是相同的,将所有内容都放在我的第五个特征中。当我在 Weka 应用程序中运行具有相同属性的完全相同的数据集时,我得到了不同的结果。下面是一个例子:
sci kit learn:
MLP
Rows classified: 6881
Accuracy: 25.970%
0 0 0 0 412 12 0 0 25 1 0 0 0
0 0 0 0 540 50 0 0 8 0 0 0 0
0 0 0 0 111 3 0 0 6 2 0 0 0
0 0 0 0 139 19 0 0 4 2 0 0 0
0 0 0 0 1630 54 0 0 106 18 0 0 0
0 0 0 0 554 63 0 0 22 0 0 0 0
0 0 0 0 246 8 0 0 33 10 0 0 0
0 0 0 0 324 39 0 0 8 0 0 0 0
0 0 0 0 605 60 0 0 90 5 0 0 0
0 0 0 0 519 31 0 0 72 4 0 0 0
0 0 0 0 455 19 0 0 10 1 0 0 0
0 0 0 0 260 11 0 0 21 1 0 0 0
0 0 0 0 236 8 0 0 21 3 0 0 0
RandomForest:
Rows classified: 6881
Accuracy: 26.174%
0 0 0 0 440 0 0 0 10 0 0 0 0
0 0 0 0 597 0 0 0 0 1 0 0 0
0 0 0 0 119 0 0 0 3 0 0 0 0
0 0 0 0 164 0 0 0 0 0 0 0 0
0 0 0 0 1774 0 0 0 34 0 0 0 0
0 0 0 0 629 0 0 0 10 0 0 0 0
0 0 0 0 268 0 0 0 29 0 0 0 0
0 0 0 0 371 0 0 0 0 0 0 0 0
0 0 0 0 733 0 0 0 27 0 0 0 0
0 0 0 0 605 0 0 0 21 0 0 0 0
0 0 0 0 484 0 0 0 1 0 0 0 0
0 0 0 0 286 0 0 0 7 0 0 0 0
0 0 0 0 263 0 0 0 5 0 0 0 0
Weka
MLP
a b c d e f g h i j k l m <-- classified as
5 504 50 1 0 0 10 28 0 0 0 0 0 | a = t1
2 1511 56 1 4 1 83 135 0 2 12 0 1 | b = t12
4 467 88 0 1 3 30 45 0 0 0 1 0 | c = t2
1 227 15 2 2 0 36 13 0 1 0 0 0 | d = t3
4 369 18 2 1 0 25 31 0 0 0 0 0 | e = t0
3 306 43 0 1 2 10 6 0 0 0 0 0 | f = t4
5 463 36 2 4 0 178 69 0 0 2 0 1 | g = t5
3 371 23 1 0 0 49 176 0 0 2 1 0 | h = t6
4 398 14 1 1 0 28 33 0 0 5 1 0 | i = t7
1 252 13 0 0 0 16 8 0 1 2 0 0 | j = t8
1 213 9 0 0 0 20 24 0 1 0 0 0 | k = t9
1 96 3 0 0 0 4 16 0 0 2 0 0 | l = t10
1 133 7 0 0 0 7 15 0 0 1 0 0 | m = t11
我也想知道是否可以像 Weka 那样打印带有类标签的混淆矩阵?这里看起来 b 列有点等于 sci kit learn 中的第五列,但很难说出它代表什么列。
最佳答案
您的数据集似乎严重不平衡 - 第 5 类非常占优势,您的模型大部分时间只是学习预测此标签。
如何处理?阅读例如 this .
关于python - Scikit 学习混淆矩阵总是看起来几乎一样,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50319858/
我不明白 int 63823 为何比 double 1.0 占用更少的空间。在这个特定实例中,int 中是否没有存储更多信息? 最佳答案 I don't understand how an int 6
这可能不是一个直接的代码问题,但它是一个经常出现在 SO 上的问题,我发现阅读它非常有用。 App Store - Help answering “Missing Compliance” (using
我在我们的应用程序中使用 syncfusion 寻呼机和下拉列表请打开以下链接。 https://stackblitz.com/edit/angular-nv6myv?file=src%2Fapp%2
以便解释指针和引用in this question我写了这段代码。 MyClass& MyClass::MyInstance() { static MyClass & myLoca
在 C 和 C++ 中,assert 是一个非常 重量级例程,将错误写入 stdout 并终止程序。在我们的应用程序中,我们实现了一个更强大的 assert 替代品,并为其提供了自己的宏。已尽一切努力
我已经创建了一个 MVC webApi 项目,现在我想使用身份验证和授权。我想我已经实现了这种安全措施,但由于某种原因,有些事情变糟了,当我编写我的凭据并尝试调用一些 webApi 方法时,显示消息“
我发现自己使用一种奇怪的方式向我的函数添加回调函数,我想知道是否有更通用的方式向函数添加回调函数,最好的情况是我的所有函数都检查最后给定的作为函数的参数,如果是,则将其用作回调。 我以前是这样的: v
几乎从来没有我只想获取某个 Remote 的情况;我总是想要所有的 Remote 。我认为这将是一个足够常见的用例,git 会考虑它(与他们有 pull.rebase true 的方式相同)。 那么,
我正在尝试使用 inarray 但它总是返回 true?有任何想法吗? (所有 li 均已显示) $("#select-by-color-list li").hide(); // get the se
我正在尝试为我公司的开发环境设置过期网址。我们使用 lighttpd在此环境中提供上传的文件,我发现 these docs这似乎相当有希望。 问题是我似乎根本无法让它工作,而且我有点不知所措,试图找出
我无法让“文件夹”外部变量工作。我总是得到[:]。 我正在 Windows 下的 Grails 上进行开发(这就是为什么外部配置文件看起来像 file:C:\path\to/file)。 我在另一个项
这个问题是出于对 PL 如何工作的好奇,而不是其他任何事情。 (它实际上是在查看与 Haskell 不同的 SML 时想到的,因为前者使用按值调用 - 但我的问题是关于 Haskell。) Haske
我有一个高速缓存内存模块,我希望它是可字寻址的,但有字节的写使能信号。 always @ (posedge clk) begin //stuff... if(write) begin
我正在处理一些代码,其中一个对象“foo”正在创建另一个对象对象“bar”,并向其传递一个Callable。之后 foo 将返回bar,然后我希望 foo 变得无法访问(即:可用于垃圾收集)。 我最初
我已将我的程序与此方法相关联: public static void CreateFileAssociation(string extension, string key, string descri
所以我正在进行目录遍历,但我无法让 opendir 按照我想要的方式工作。它总是无法打开我发送的目录,它给出了一些未知的错误。我通常传入 argv[1],但我放弃了,只是开始硬编码路径。 char *
这个问题在这里已经有了答案: How do I compare strings in Java? (23 个回答) 关闭 9 年前。 出于某种原因,我的(基本)程序总是打印我为 else 语句保留的
我不想冒为此提出破解的风险,因为它涉及 datetime 对象。基本上,我想按如下方式进行转换: 2010-04-21 06:37:53 -> 2010-04-21 06:40:00 2010-08-
我正在用 C 语言玩文件 I/O。我正在尝试使用 fgets 从一个文件中读取数据并将其输出到另一个文件。问题是它总是返回 NULL,因此没有任何内容被复制到输出文件中。这是我的代码: #includ
class MyClass { // empty class with no base class }; int main() { MyClass* myClass = new MyC
我是一名优秀的程序员,十分优秀!