gpt4 book ai didi

python - 哪种模型/技术用于特定句子提取?

转载 作者:行者123 更新时间:2023-12-05 05:47:33 25 4
gpt4 key购买 nike

我有一个客户和客户支持之间数以万计的对话/对话的数据集。这些对话可能是论坛帖子,也可能是冗长的电子邮件对话,都经过手工注释以突出显示包含客户问题的句子。例如:

Dear agent, I am writing to you because I have a very annoying problem with my washing machine. I bought it three weeks ago and was very happy with it. However, this morning the door does not lock properly. Please help

Dear customer.... etc

突出显示的句子是:

However, this morning the door does not lock properly.

  1. 我可以采用什么方法对此进行建模,以便将来可以自动提取客户问题?数据集的领域很广泛,但在硬件空间内,因此它可以是电器、小工具、机械等。
  2. 这种类型的问题叫什么?我认为这可能被称为“意图识别”,但大多数指南似乎都指的是多类分类。这句话要么是要么不是客户的问题。我考虑过分析每个句子并执行二元分类,但我想探索尽可能考虑其余对话上下文的选项。
  3. 有哪些资源可用于研究如何在 Python 中实现这一点(使用 tensorflow 或 pytorch)

我找到了一个 model on HuggingFace它已经通过客户对话进行了预训练,并阅读了研究论文,所以我考虑将其作为起点进行微调,但在涉及到转换器时,我只有文本(多类/多标签)分类的经验。

最佳答案

如果你想从原始输入文本中得到一个特定的句子(不做任何修改),这通常被称为“跨度分类”,其中输出是特定句子的第一个和最后一个单词的索引。现在最先进的是像 BERT 这样的注意力模型.您可以检查为 huggingface 中的“跨度分类”问题设计的 Bert 模型,如 RobertaForQuestionAnswering https://huggingface.co/docs/transformers/model_doc/roberta#transformers.TFRobertaForQuestionAnswering使用 TensorFlow 或 PyTorch 库。

关于python - 哪种模型/技术用于特定句子提取?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70990722/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com