gpt4 book ai didi

algorithm - 词分类算法优缺点

转载 作者:塔克拉玛干 更新时间:2023-11-03 03:57:44 25 4
gpt4 key购买 nike

对于大学项目,我需要构建一个软件,根据对虚拟建筑工地的一些评论,检测其实际状态(刚开始正在施工终止)。

例如,给定评论:

  • “很高兴听到我们可以步行穿过英吉利海峡大桥”
  • “昨天去新建的桥跟 friend 去法国旅游”
  • “他们刚刚完成工地,第 5 英里处已经出现裂缝。真令人失望!”

系统应检测到“英吉利海峡大桥”施工现场已经结束。

目前我正在尝试选择要用于该项目的单词分类算法。我在网上搜索寻找最好的分类算法来使用。我读过有关 SVC 的内容,但由于我不是该领域的真正专家,所以我不确定 SVC 是否符合我的场景。

我想要获得的不是我的问题的解决方案,而是可用算法及其优缺点的列表。

最佳答案

您对问题的表述不正确,导致人们很难给您列出优缺点。

您所描述的问题实际上并不是单词分类问题,因为您没有对单词进行分类。你要做的是:

  1. build 项目的命名实体识别
  2. 根据提及上下文将每个构造命名实体分为 3 种不同类型。

算法不是真正的问题。大多数分类算法(线性回归、决策树、SVM 等)都可以工作。

您实际遇到的问题(但根据您的问题没有意识到)是您没有训练数据用于查找 build 项目命名实体或一旦将这些实体分类到您的3 类。

我的建议是,您可以使用其中一种免费提供的 NER 工具包/库,添加与建筑项目相关的字典功能(例如桥梁、塔等...),然后看看您在你任务的第一部分。

更重要的考虑因素是:

  1. 您需要多少时间/金钱来获取带注释的数据?
  2. 您需要什么样的表现?
  3. 您愿意考虑哪些语言/库(恕我直言,最不重要的问题)

对不起,我知道这可能不是您想听到的答案,但我想这是您需要的答案。 ;)

关于algorithm - 词分类算法优缺点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36687365/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com