gpt4 book ai didi

python - sklearn中CountVectorizer(binary=True)和n CountVectorizer(binary=False)有什么区别

转载 作者:太空宇宙 更新时间:2023-11-03 20:42:38 31 4
gpt4 key购买 nike

我通过定义 ngram_vectorizer = CountVectorizer(binary=True) 和 ngram_vectorizer = CountVectorizer(binary=False) 来运行脚本

两者的混淆矩阵结果不同。可以帮助我理解二进制文件的作用吗?

最佳答案

如果您设置binary=True,则 CountVectorizer 不再使用术语/标记的计数。如果文档中存在标记,则其值为 1;如果不存在,则无论其出现频率如何,其值为 0。所以你将只处理二进制值。默认情况下,binary=False

参见usage examples here

关于python - sklearn中CountVectorizer(binary=True)和n CountVectorizer(binary=False)有什么区别,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56773265/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com