- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试构建一个以 TensorFlow 目录中的示例为模型的深度神经网络分类器。示例代码如下:
def main(unused_argv):
# Load dataset.
iris = learn.datasets.load_dataset('iris')
x_train, x_test, y_train, y_test = cross_validation.train_test_split(
iris.data, iris.target, test_size=0.2, random_state=42)
# Build 3 layer DNN with 10, 20, 10 units respectively.
classifier = learn.DNNClassifier(hidden_units=[10, 20, 10], n_classes=3)
# Fit and predict.
classifier.fit(x_train, y_train, steps=200)
score = metrics.accuracy_score(y_test, classifier.predict(x_test))
print('Accuracy: {0:f}'.format(score))
除了我使用的数据与虹膜数据(连续特征值和离散的 0 或 1 目标值)相同外,我正在做完全相同的事情。此处显示了我的数据示例:
G1 G2 G3 G4 Target
7.733347 6.933914 6.493334 5.31336 0
6.555225 6.924448 6.353376 5.568334 1
7.515558 6.326627 6.197123 5.565245 0
7.132243 6.733111 7.107221 5.681575 1
我正在使用以下代码读取我的数据:
def extract_examples_labels(filepath):
data = pd.read_csv(filepath).as_matrix()
num_inputs = len(data[0])-1
data_examples = data[:,range(num_inputs)]
data_labels= data[:,len(data[0])-1]
return data_examples, data_labels
然后我执行与 TensorFlow 示例中完全相同的操作,但我使用我的数据代替。但是,我不断收到一条错误消息:
ValueError:目标的数据类型应为 int32、int64 或兼容。取而代之的是 dtype: 'float64'
所以我认为这意味着因为我的 y_train 是一个 float ,所以我需要将它转换为一个 int,所以我这样做使用:
y_train = y_train.astype(int)
我确认它是 int64 类型并再次运行分类器但出现以下错误:
ValueError:目标与给定信息不兼容。给定目标:Tensor("output:0", shape=(?,), dtype=int64),所需签名:TensorSignature(dtype=tf.float64, shape=TensorShape([Dimension(None)]), is_sparse=False) .
现在它说它想要一个 float64。所以我很困惑我做错了什么。有什么建议或明显的错误吗?
最佳答案
经过一番挖掘,我找到了解决方案。如果您查看 TensorFlow 包中的以下目录:
tensorflow.contrib.learn.python.learn.datasets
您可以找到一个名为base.py 的文件,它具有csv 文件加载功能。基本上,我只是修改了名为 load_csv 的函数来接收我的文件。代码如下所示:
Dataset = collections.namedtuple('Dataset', ['data', 'target'])
Datasets = collections.namedtuple('Datasets', ['train', 'validation', 'test'])
def load_csv(filename, target_dtype, target_column=-1, has_header=True):
"""Load dataset from CSV file."""
with gfile.Open(filename) as csv_file:
data_file = csv.reader(csv_file)
if has_header:
header = next(data_file)
n_samples = int(header[0])
n_features = int(header[1])
data = np.empty((n_samples, n_features))
target = np.empty((n_samples,), dtype=np.int)
for i, ir in enumerate(data_file):
target[i] = np.asarray(ir.pop(target_column), dtype=target_dtype)
data[i] = np.asarray(ir, dtype=np.float64)
else:
data, target = [], []
for ir in data_file:
target.append(ir.pop(target_column))
data.append(ir)
return Dataset(data=data, target=target)
因此,如果您看到上面的代码,我认为我遇到的问题是 target_dtype 属性。尽管我更改了目标数组的 dtype,但我没有更改 target_dtype 属性,这使得 TensorFlow 检查签名时看起来不兼容。我的代码现在可以工作了 =。如果您有任何疑问或可以进一步澄清,请随时提出!
关于python - TensorFlow/Sklearn 深度神经网络分类器类型错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37769860/
我知道有几个类似的问题被问到,但我的问题仍然没有得到解答。 问题来了。我使用命令 python3 -m pip3 install -U scikit-learn 来安装 sklearn、numpy 和
_train_weather.values : [[ 0.61818182 0.81645199 0.6679803 ..., 0. 0. 1.
如果我有一个数据集X及其标签Y,那么我将其分为训练集和测试集,scle为0.2,并使用随机种子进行洗牌: 11 >>>X.shape (10000, 50,50) train_data, test_d
首先我查看了所有相关问题。给出了非常相似的问题。 所以我遵循了链接中的建议,但没有一个对我有用。 Data Conversion Error while applying a function to
这里有两种标准化方法: 1:这个在数据预处理中使用:sklearn.preprocessing.normalize(X,norm='l2') 2:分类方法中使用另一种方法:sklearn.svm.Li
所以刚看了一个教程,作者不需要import sklearn使用时 predict anaconda 环境中pickled 模型的功能(安装了sklearn)。 我试图在 Google Colab 中重
我想评估我的机器学习模型。我使用 roc_auc_score() 计算了 ROC 曲线下的面积,并使用 sklearn 的 plot_roc_curve() 函数绘制了 ROC 曲线。在第二个函数中,
我一直在寻找此信息,但在任何地方都找不到,所以这是我的镜头。 我是Python 2.7的初学者,我学习了一个模型,感谢cPickle我保存了它,但现在我想知道是否可以从另一个设备(没有sklearn库
>>> import sklearn.model_selection.train_test_split Traceback (most recent call last): File "", li
在阅读有关使用 python 的 LinearDiscriminantAnalysis 的过程中,我有两种不同的方法来实现它,可在此处获得, http://scikit-learn.org/stabl
我正在使用 sklearn,我注意到 sklearn.metrics.plot_confusion_matrix 的参数和 sklearn.metrics.confusion_matrix不一致。 p
我正在构建一个多标签文本分类程序,我正在尝试使用 OneVsRestClassifier+XGBClassifier 对文本进行分类。最初,我使用 Sklearn 的 Tf-Idf 矢量化来矢量化文本
我想看看模型是否收敛于我的交叉验证。我如何增加或减少 sklearn.svm.SVC 中的时代? 目前: SVM_Model = SVC(gamma='auto') SVM_Model.fit(X_t
有人可以帮助我吗?我很难知道它们之间的区别 from sklearn.model_selection import train_test_split from sklearn.cross_valida
我需要提取在 sklearn.ensemble.BaggingClassifier 中训练的每个模型的概率。这样做的原因是为了估计 XGBoostClassifier 模型的不确定性。 为此,我创建了
无法使用 scikit-learn 0.19.1 导入 sklearn.qda 和 sklearn.lda 我得到: 导入错误:没有名为“sklearn.qda”的模块 导入错误:没有名为“sklea
我正在尝试在 google cloud ai 平台上创建一个版本,但找不到 impute 模块 No module named 'sklearn.impute._base; 'sklearn.impu
我在 PyQt5 中编写了一个 GUI,其中包括以下行 from sklearn.ensemble import RandomForestClassifier 。 遵循this answer中的建议,
我正在做一个 Kaggle 比赛,需要输入一些缺失的数据。我安装了最新的Anaconda(4.5.4)具有所有相关依赖项(即 scikit-learn (0.19.1) )。 当我尝试导入模块时,出现
在安装了所需的模块后,我正在尝试将imblearn导入到我的Python笔记本中。但是,我收到以下错误:。。附加信息:我使用的是一个用Visual Studio代码编写的虚拟环境。。我已经确定venv
我是一名优秀的程序员,十分优秀!