gpt4 book ai didi

java - 通过 Lucene 将文档表示为 vector 。

转载 作者:太空宇宙 更新时间:2023-11-04 08:33:43 25 4
gpt4 key购买 nike

我想构建用于 SVM 文本分类的文档 vector 。我已将我的文档索引为 2 个正文档和负文档。我用 IG 方法选择了我的特征空间。

如何通过 Lucene 将文档表示为具有 tf-idf 权重项的 vector 。

谢谢!

致以诚挚的问候!

最佳答案

Apache Mahout是一个Java机器学习库。它具有create document vectors from lucene index的实用程序(从原始文本创建)。您可以根据您的要求采用代码。

关于java - 通过 Lucene 将文档表示为 vector 。,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6882063/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com