gpt4 book ai didi

python - 使用轮廓分数

转载 作者:行者123 更新时间:2023-11-30 08:57:05 25 4
gpt4 key购买 nike

我有一个数据集,其中每个数据点都有 9 个类。对于属于数据集的每个图像,我将其传递给 ResNet50,并通过稍后对最后一个进行切割来提取 2048 个特征向量。我已按照与 csv 文件相同的顺序将一个数据点的每一行 ResNet50 特征向量保存在 txt 文件中。

我想计算数据集中每个类别的 Silouhette 分数。我不知道如何继续我的设置。我没有太多代码,但这是一个入门者:

import pandas as pd
from sklearn.metrics import pairwise_distances
from sklearn import cluster, datasets, preprocessing, metrics
from sklearn.cluster import KMeans
df = pd.read_csv("master.csv")
labels = df['Q3 Theme1']
X = open('entire_dataset__resnet50_feature_vectors.txt')
X_Data = X.read()
print('Silhouette Score:', metrics.silhouette_score(X_Data, labels,
metric='cosine'))

我得到这个输出:https://pastebin.com/raw/hk2axdWL

如何修复此代码以便可以打印单个轮廓分数?

Reshape your data either using array.reshape(-1, 1) if your data has a single feature or array.reshape(1, -1) if it contains a single sample.

Process finished with exit code 1

我已将特征向量文件(.txt 文件)的一行粘贴到此处:https://pastebin.com/raw/hk2axdWL (由 2048 个数字组成,以空格分隔)

最佳答案

我认为问题出在您想要读取 X 的行上。我稍微改变了你的代码。

from sklearn.metrics import pairwise_distances
from sklearn import cluster, datasets, preprocessing, metrics
from sklearn.cluster import KMeans
df = pd.read_csv("master.csv")
labels = df['Q3 Theme1']
X = open('entire_dataset__resnet50_feature_vectors.txt')
X_Data = X.read()
print('Silhouette Score:', metrics.silhouette_score(X_Data, labels,
metric='euclidean'))

关于python - 使用轮廓分数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56117011/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com