- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 Scikit Learn 提供的神经网络实现来实现图像处理。我有近 10,000 张“JPG”格式的彩色图像,我将这些图像转换为“PNG”格式并删除了颜色信息。新图像都是黑色或白色图像。将这些图像转换为矢量格式后,这些图像矢量构成了神经网络的输入。
对于每个图像,还有一个输出,它构成了神经网络的输出。
输入文件只有 0 和 1 的值,没有任何其他值。每个图像的输出对应于一个连续的向量,该向量介于 0 和 1 之间,长度为 22。即每个图像的输出是一个长度为 22 的向量。
为了开始处理,我开始时只有 100 张图像及其相应的输出,但出现了以下错误:
ValueError: Array contains NaN or infinity
我还要指出,第一次迭代在这里完成,我在第二次迭代时遇到了这个错误。
为了尝试一些不同的东西,我将我的输入和输出缩减为每张 10 张图像。使用同一段代码(很快就会出现),我能够完成 7 次迭代(我已将迭代次数设置为 20),然后收到相同的错误。
然后我将迭代次数更改为 5,只是为了检查它是否有效。进行此更改后,我收到以下错误:
ValueError: bad input shape (10, 22)
我还尝试在我的输入和输出上使用 np.reval()
但这又给了我 NaN 或 Infinity
错误。
这是我在整个过程中使用的代码:
import numpy as np
import csv
import matplotlib.pyplot as plt
from scipy.ndimage import convolve
from sklearn import linear_model, datasets, metrics
from sklearn.cross_validation import train_test_split
from sklearn.neural_network import BernoulliRBM
from sklearn.pipeline import Pipeline
def ReadCsv(fileName):
in_file = open(fileName, 'rUb')
reader = csv.reader(in_file, delimiter=',', quotechar='"')
data = [[]]
for row in reader:
data.append(row)
data.pop(0)
return data
X_train = np.asarray(ReadCsv('100Images.csv'), 'float32')
Y_train = np.asarray(ReadCsv('100Images_Y_new.csv'), 'float32')
X_test = np.asarray(ReadCsv('ImagesForTest.csv'), 'float32')
Y_test = np.asarray(ReadCsv('ImagesForTest_Y_new.csv'), 'float32')
logistic = linear_model.LogisticRegression()
rbm = BernoulliRBM(random_state=0, verbose=True)
classifier = Pipeline(steps=[('rbm', rbm), ('logistic', logistic)])
rbm.learning_rate = 0.06
rbm.n_iter = 5
rbm.n_components = 100
logistic.C = 6000.0
classifier.fit(X_train, Y_train)
print()
print("Logistic regression using RBM features:\n%s\n" % (
metrics.classification_report(
Y_test,
classifier.predict(X_test))))
如果能就此问题提供任何形式的帮助,我将不胜感激。
TIA。
最佳答案
将学习率更改为较小的值可能会解决此问题。 (即 rbm.learning_rate)
至少这解决了我之前遇到的问题。
关于python - 使用 ScikitLearn 的神经网络实现时出现的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20849281/
在 this section关于梯度提升的文档,它说 Gradient Boosting attempts to solve this minimization problem numerically
我正在将 ScikitLearn 的随机森林应用于极度不平衡的数据集(比率为 1:10 000)。我可以使用 class_weigth='balanced' 参数。我看过它相当于欠采样。 但是,这种方
我正在尝试使用 Scikit Learn 提供的神经网络实现来实现图像处理。我有近 10,000 张“JPG”格式的彩色图像,我将这些图像转换为“PNG”格式并删除了颜色信息。新图像都是黑色或白色图像
如何设置 ScikitLearn 的 ConfusionMatrixDisplay 绘制的图形的大小? import numpy as np from sklearn.metrics import C
我是机器学习新手,目前正在使用 ScikitLearn 的 MLPClassifier 来执行神经网络任务。根据 Andrew Ng 著名的机器学习类(class),我正在绘制学习曲线,在我的例子中,
docs对于 scikit-learn 的 Imputation transformer 说 When axis=0, columns which only contained missing val
这在统计数据交换上可能与这里同样有效(可能是我不确定的统计数据或Python。 假设我有两个自变量 X,Y 来解释 Z 的一些方差。 from sklearn.linear_model imp
我目前正在处理给定类标签 0 和 1 的分类任务。为此,我使用 ScikitLearn 的 MLPClassifier 为每个训练示例提供 0 或 1 的输出。但是,我找不到任何文档,说明 MLPCl
我目前正在处理给定类标签 0 和 1 的分类任务。为此,我使用 ScikitLearn 的 MLPClassifier 为每个训练示例提供 0 或 1 的输出。但是,我找不到任何文档,说明 MLPCl
我的目标是从数百万行的数据集中执行文本聚类,其中每一行都是一串单词,与正确的单词不对应文档,而是“关键字”列表。这个想法是,每一行代表一个 Twitter 用户,其关键字列表取自他/她的推文,以下是行
以下示例展示了如何使用 Sklearn 20 新闻组数据训练分类器。 >>> from sklearn.feature_extraction.text import TfidfVectorizer >
尝试开始使用 Python 的 SciKitLearn 库,但对 NearestNeighbors 分类器和 KNeighbors 分类器之间的区别感到困惑。看起来论点相似但又不完全相同......
所以我目前正在从事一个涉及使用主成分分析或 PCA 的项目,并且我正在尝试快速学习它。幸运的是,Python 有一个来自 scikitlearn.decomposition 的非常方便的模块,它似乎为
是否可以在 Python/Scikit-learn GLM 模型中按原样使用分类变量?我确实意识到了 one-hot 编码的替代方案。我对这种方法的问题是我将无法测试整个变量的重要性。我只能测试编码变
我有交通数据,我想通过向模型显示以下输入来预测下一小时的车辆数量:这一小时的车辆数量和这一小时的平均速度值。这是我的代码: dataset=pd.read_csv('/content/final -
我正在学习 scikit 学习执行某些分类。我正在按照我的数据集的教程进行操作。当我运行脚本时,出现类型错误 data = pd.DataFrame({'Description': pd.Catego
我创建了一个用于欺诈检测的机器学习模型: 实际模型代码的一小段如下: from sklearn.metrics import classification_report, accuracy_score
我运行一个 python 程序,它调用 sklearn.metrics 的方法来计算精度和 F1 分数。这是没有预测样本时的输出: /xxx/py2-scikit-learn/0.15.2-comp6
我在执行以下代码块时引用了以下博客文章 https://prateekvjoshi.com/2015/12/15/how-to-compute-confidence-measure-for-svm-c
抱歉,如果这可能已经在某处得到了回答,但我一直在寻找大约一个小时,但找不到好的答案。 我有一个在 Scikit-Learn 中训练的简单逻辑回归模型,我将其导出到 .pmml 文件。 from s
我是一名优秀的程序员,十分优秀!