gpt4 book ai didi

python - 如何在 Python 中对一组单词进行分词

转载 作者:行者123 更新时间:2023-12-01 01:46:03 25 4
gpt4 key购买 nike

我正在用 python 开发一个应用程序,它根据上传的简历提供工作推荐。我正在尝试在进一步处理之前对简历进行标记。我想标记一组单词。例如,数据科学是一个关键字,当我标记时,我将分别获得数据科学。如何克服这种情况。有没有任何库可以在 python 中进行这些提取?

最佳答案

看起来您正在寻找生成 n-grams (特别是二元语法)。如果是这种情况,以下是实现此目的的一种方法:

from nltk import ngrams
resume = '... working in the data science field for years ...'
n = 2
bigrams = ngrams(resume.split(), n)
for grams in bigrams:
print grams

关于python - 如何在 Python 中对一组单词进行分词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51335911/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com