gpt4 book ai didi

machine-learning - 使用哪个斯坦福 NLP 包进行内容分类

转载 作者:行者123 更新时间:2023-11-30 09:02:02 24 4
gpt4 key购买 nike

我的表格中有大约 5000 个术语,我想将它们分组为有意义的类别。

例如,一些术语是:

日产

福特

被捕

吉普车

法庭

结果应该是 Nissan、Ford、Jeep 归为一类,Arrested 和 Court 归为另一类。我查看了斯坦福自然语言处理分类器。我是否可以假设这是为我做这件事的正确选择?

最佳答案

我建议您使用NLTK如果没有很多专有名词的话。您可以使用 WordNet 的语义相似度作为特征并尝试对单词进行聚类。这是 discussion关于如何做到这一点。

要使用斯坦福分类器,您需要知道需要多少个桶(类)的单词。此外,我认为这是针对文档而不是文字。

关于machine-learning - 使用哪个斯坦福 NLP 包进行内容分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21410490/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com