gpt4 book ai didi

python - 检查数组或 Dataframe 的所有可能标签 (y)

转载 作者:太空宇宙 更新时间:2023-11-03 14:59:26 25 4
gpt4 key购买 nike

我有一个包含 12k 个样本的数据集,每个样本都有一个标签 y。如何从这 12k 个样本中提取所有可能的输出? (输出可能有 50 到 60 个不同的值……我不知道)。

是否有内置函数可以实现此目的?与在所有样本上使用 for 60 次不同的方式......我不认识你,但这种处理的损失让我感到不安,并使代码变得如此丑陋。

注意:我不需要每个样本的 y 列表,我只想知道我有多少 y,这样我就可以设置学习模型的“输出数量”。

我解决了这个问题:

    notfound = 0
n_outputs = 0
for num in range(1,80):
temp = n_outputs
try:
for i in range(len(y)):
if int(y[i]) == num:
n_outputs += 1
raise StopIteration

except StopIteration:
pass
if temp == n_outputs:
notfound += 1
if notfound == 3:
break

print(n_outputs)

但是还有别的办法吗?

最佳答案

如果您有数组形式的数据,请先将其转换为 pandas 数据帧,然后执行 data['output'].unique()。它将为您提供独特输出的列表。 data['output'].nunique() 为您提供输出列中唯一值的数量。 data 是您的数据框,output 是您的标签列。

关于python - 检查数组或 Dataframe 的所有可能标签 (y),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45244043/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com