gpt4 book ai didi

java - 创建数据集: extract features from text documents (TF-IDF)

转载 作者:行者123 更新时间:2023-11-30 05:12:27 25 4
gpt4 key购买 nike

我必须从一些文本文件创建一个数据集,将它们写为特征向量。

类似这样的事情:

doc1: 1,0.45 6,0.001 94,0.1 ...

doc2: 3,0.5 98,0.2 ...

...

vector 的每个位置代表一个单词,分数由 TF-IDF 等给出。

你知道一些库/工具/相关的东西吗? (java更好)

最佳答案

几天后,我找到了“完美的工具”:Word Vector Tool。 http://sourceforge.net/projects/wvtool/

关于java - 创建数据集: extract features from text documents (TF-IDF),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2921500/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com