gpt4 book ai didi

machine-learning - NLP 和 ML 短语提取

转载 作者:行者123 更新时间:2023-11-30 09:52:41 25 4
gpt4 key购买 nike

我可以使用哪些机器学习算法来训练给定句子中的 Action 短语。

Sentence1:I want to play cricket 
Label1: play cricket

Sentence2: Need to wash my clothes
Label2: wash clothes

我有大约 2k 个句子和相应的 Action 短语(标签)的数据,需要根据它们预测另一组句子。有人可以指导我如何使用 NLP/ML 来做到这一点吗?哪个算法可以用于相同的目的? (最好是Python)

最佳答案

以下是句子分类的过程:

1) 标准化文本 - 将所有文本变为小写

2) 删除所有停用词 - 确保仅留下相关功能

3)将句子标记为一元标记

4) 应用词干提取技术 - 尝试不同的词干提取模型/词形还原器,将单词转化为基本词。查看哪一种最适合您的情况。例如:play、played、plays 将转换为基本词“play”。此步骤减少了特征数量。

5) 为所有句子创建术语文档矩阵。 TDM 的每一行对应于一个句子,TDM 的每一列对应于该句子的一个标记。 (还有另一种以矩阵形式表示文本的方法,称为 Tf-Idf)

6) 现在这个术语文档矩阵包含标记作为列。您已经将标签放置到位。您现在可以开始训练 ML 模型。我假设您知道如何完成这一部分。

关于machine-learning - NLP 和 ML 短语提取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42038622/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com