gpt4 book ai didi

python - nltk 四元组搭配查找器

转载 作者:太空宇宙 更新时间:2023-11-03 11:00:16 26 4
gpt4 key购买 nike

我看到很多问题和答案都说 NLTK 搭配不能超出 bi 和 tri gram。

例如这个 - How to get n-gram collocations and association in python nltk?

我看到有个东西叫

nltk.QuadgramCollocationFinder

类似于

nltk.BigramCollocationFinder 和 nltk.TrigramCollocationFinder

但同时无法看到类似的东西

nltk.collocations.QuadgramAssocMeasures()

类似于nltk.collocations.BigramAssocMeasures() 和 nltk.collocations.TrigramAssocMeasures()

如果 nltk.QuadgramCollocationFinder 不可能(没有 hack)找到 bi 和 tri gram 之外的 n-gram,那么它的目的是什么。

也许我遗漏了什么。

谢谢,

添加代码并根据 Alvas 的输入更新问题,这现在有效

import nltk
from nltk.collocations import *
from nltk.corpus import PlaintextCorpusReader
from nltk.metrics.association import QuadgramAssocMeasures

bigram_measures = nltk.collocations.BigramAssocMeasures()
trigram_measures = nltk.collocations.TrigramAssocMeasures()
quadgram_measures = QuadgramAssocMeasures()

the_filter = lambda *w: 'crazy' not in w

finder = BigramCollocationFinder.from_words(corpus)
finder.apply_freq_filter(3)
finder.apply_ngram_filter(the_filter)
print (finder.nbest(bigram_measures.likelihood_ratio, 10))


finder = QuadgramCollocationFinder.from_words(corpus)
finder.apply_freq_filter(3)
finder.apply_ngram_filter(the_filter)
print(finder.nbest(quadgram_measures.likelihood_ratio,10))

最佳答案

来自repo :

from nltk.metrics.association import QuadgramAssocMeasures

关于python - nltk 四元组搭配查找器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34230592/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com