gpt4 book ai didi

c# - 文本分类算法

转载 作者:太空狗 更新时间:2023-10-30 00:28:09 28 4
gpt4 key购买 nike


我有数百万个简短(最多 30 个单词)的文档,我需要将它们分成几个已知的类别。一个文档有可能匹配几个类别(很少,但有可能)。文档也可能与任何类别都不匹配(也很少)。我还有数百万份已经分类的文件。我应该使用什么算法来完成这项工作。我不需要那么快。我需要确保算法正确分类(尽可能)。
我应该使用什么算法? in在C#中有实现吗?
感谢您的帮助!

最佳答案

看看term frequency and inverse document frequency还有cosine similarity找到重要的词来创建类别并根据相似性将文档分配给类别

编辑:

找到一个例子here

关于c# - 文本分类算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3890734/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com