gpt4 book ai didi

nlp - 寻找取自维基百科的 n-gram 数据库

转载 作者:行者123 更新时间:2023-12-04 08:46:31 25 4
gpt4 key购买 nike

我正在有效地尝试解决与此问题相同的问题:

Finding related words (specifically physical objects) to a specific word

减去单词代表物理对象的要求。答案和编辑过的问题似乎表明,使用维基百科文本作为语料库构建 n-gram 频率列表是一个好的开始。在我开始下载庞大的维基百科转储之前,有谁知道这样的列表是否已经存在?

PS如果上一个问题的原始海报看到这个,我很想知道你是如何解决这个问题的,因为你的结果看起来很棒:-)

最佳答案

Google has a publicly available TB n-garam 数据库(最多 5 个)。
您可以订购 6 张 DVD 或查找托管它的 Torrent。

关于nlp - 寻找取自维基百科的 n-gram 数据库,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2325210/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com