gpt4 book ai didi

java - 带中文的 Word2Vec

转载 作者:行者123 更新时间:2023-11-30 10:44:29 26 4
gpt4 key购买 nike

我一直在学习 Word2Vec(Deeplearning4j),但我找不到任何关于它支持中文的信息。从各种 channel 我了解到,通过使用一些插件,它也可以用于中文。

所以请告诉我任何中文插件,以及它应该如何用 word2vec 实现。

Deeplearning4j Word2Vec 是否适合英语和中文(两种)支持。如果不是,请通过它的链接建议一些更好的选择。

语言:Java

最佳答案

正如其他评论中提到的,word2vec 是一组带有预训练英语词 vector 的词。同样,您可以找到其他包含中文词 vector 的数据集。我正在使用 Python,但我认为编程语言并不重要,因为您要查找的是数据集而不是模型或程序。

这是腾讯人工智能实验室训练的中文词嵌入数据集,包含超过 800 万个中文单词和短语:https://ai.tencent.com/ailab/nlp/en/embedding.html

关于java - 带中文的 Word2Vec,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37385239/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com