gpt4 book ai didi

python - 斯坦福自然语言处理 : How to get chunks

转载 作者:太空宇宙 更新时间:2023-11-04 03:21:10 25 4
gpt4 key购买 nike

所以在 nltk 中,我们可以指定 POS 标签的正则表达式来提取文本 block 作为

sentence = [("the", "DT"), ("little", "JJ"), ("yellow", "JJ"), 
... ("dog", "NN"), ("barked", "VBD"), ("at", "IN"), ("the", "DT"), ("cat", "NN")]

grammar = "NP: {<DT>?<JJ>*<NN>}"

cp = nltk.RegexpParser(grammar)
result = cp.parse(sentence)
print(result)
(S
(NP the/DT little/JJ yellow/JJ dog/NN)
barked/VBD
at/IN
(NP the/DT cat/NN))

是否可以使用 stanford nlp 做这样的事情?我想做的是使用 stanford POS 标记器来标记我的文本,因为我发现它比 nltk 的标记器更准确。我想一旦我有了标记的句子,我就可以使用上面的代码了。斯坦福 NLP 是否仍然提供开箱即用的东西来创建文本 block ?

此外,我知道 nltk 3 提供 stanford NLP 支持。那么我如何将两者结合起来以获得文本 block 呢?我更愿意在 python 中执行此操作。

最佳答案

如果您知道要将其视为 block 的模式,则可以使用 TokensRegex将它们聚类。

关于python - 斯坦福自然语言处理 : How to get chunks,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34689356/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com