gpt4 book ai didi

python - 在新的 DataFrame 上使用经过训练的分类器

转载 作者:行者123 更新时间:2023-11-30 09:19:42 25 4
gpt4 key购买 nike

我已经构建了一个分类器,并根据标记数据进行了训练和测试。现在我想通过对没有标签的数据集进行预测来进一步测试它。我自己已经知道标签,但为了测试目的我想删除它们,并让它打印出预测值为 0 的值,这样我就可以自己比较准确性。我使用以下代码迭代数据集并对 DataFrame 中的每一行进行预测;

malware = set()

for index, row in dataset.iterrows():
res = clf.predict([row])
if res == 0:
malware.add(index)

print(malware)
f.write(str(malware) + "\n")

它似乎有效,但这不是一个快速的过程,有没有更好的方法或我可以做的事情来加快速度?

最佳答案

使用 for 循环迭代数据集中的元素通常很慢。您想要做的是将函数应用于列中的每个元素,并根据结果生成一系列标签。 (顺便说一下,假设您使用 Pandas 作为数据框)

 labels=dataset.apply(clf.predict)

然后您可以使用 for 循环浏览本系列。这应该是相对即时的。

关于python - 在新的 DataFrame 上使用经过训练的分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44529206/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com