gpt4 book ai didi

python - 在Python中对上下文中的多个多词短语进行分类的NLP策略

转载 作者:行者123 更新时间:2023-11-30 10:00:20 26 4
gpt4 key购买 nike

我需要一些帮助来选择 NLP 策略来对日记条目进行分类。以下是日记条目的外观以及正确分类的示例。

“昨天,我睡得很糟糕。我感觉很累,所以我当天的工作效率不是很好。”

分类:“ sleep :糟糕”和“生产力:不是很好”

我有一大套个人日记。人们会谈论他们已经做过(或尝试做)的事情以及结果如何(“好”,“坏”)。每个条目将有多次尝试和评级,我需要正确匹配它们。

现在,我可以采取的一种方法是在 Python 中使用 Spacy 的匹配器并给出一个多单词属性列表,例如

# Initialize the Matcher with the shared vocabulary
matcher = Matcher(nlp.vocab)

# Create a pattern matching two tokens: "iPhone" and "X"
pattern = [{'TEXT': 'not'}, {'TEXT': 'very'}, {'TEXT': 'good'}]

但是,问题是,即使我想出了一本新的评级和元素字典,我如何在上下文中匹配它们,例如正确的属性/形容词/评级与正确的元素(如生产力或 sleep )。

我确信有一种更有效的方法可以做到这一点,但我不太确定。任何帮助都会很棒,如果我可以更好地解决这个问题,请告诉我。

最佳答案

我会发表评论,但我的声誉太低,但这是 NLP 的一个非常有趣的应用。如果您的期刊已经有类别,我会研究机器学习方法。我最喜欢的文本分类工具是 fasttext ( https://fasttext.cc/docs/en/supervised-tutorial.html )

无论如何,祝你好运!

关于python - 在Python中对上下文中的多个多词短语进行分类的NLP策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59258343/

26 4 0
文章推荐: javascript - 使用 jquery 的 forEach 和 templatePlugin 追加
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com