gpt4 book ai didi

python - 在 R 中混合使用文本和分类列进行文本分析

转载 作者:行者123 更新时间:2023-11-30 22:36:21 25 4
gpt4 key购买 nike

我有一个 IT 操作工单数据集,其中包含工单编号、描述、类别、子类别、优先级等字段。

我需要做的是使用可用数据(除了票号)来预测票证优先级。示例数据如下所示。

Number  Priority Created_on Description               Category     Sub Category
719515 MEDIUM 05-01-2016 MedWay 3rd Lucene.... Server Change
720317 MEDIUM 07-01-2016 DI - Medway 13146409 Application Incident
720447 MEDIUM 08-01-2016 DI QLD Chermside.... Application Medway

请指导我。

最佳答案

在没有更多内容的情况下回答有点困难,这更像是上下文问题而不是代码问题。但这里是我用来开始评估这个问题的逻辑,请记住,它可能涉及编写一些单独的脚本,每个脚本执行部分任务。

尝试将问题分解为更小的部分。如果没有所有数据,您就无法进行分析,因此请从创建数据开始。

您的类别和子类别已经列出了每个列表中的所有独特因素,并根据您的系统和业务需求为每个因素创建了一组权重。当您制定子类别权重时,请记住它们将如何与类别相互作用(+/-以及大小)。

编写一个脚本来阅读描述,计算所有重要的单词。为单词创建某种分类,以帮助您构建列表,为模型提供类别和子类别信息。该值是错误消息、机器名称还是可以使用关键字提取的其他代码或问题类型?

所有单词分组有何意义?这将如何有助于做出决定?

当你决定这些事情时,请考虑一下类别。

然后使用所有部件,决定模型、构建、测试和完善。我知道其中没有代码,但数据科学的问题解决部分大多数时候都发生在代码之外。

您需要自己编写代码。如果您在编辑后遇到困难,我们可以提供帮助。

关于python - 在 R 中混合使用文本和分类列进行文本分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44200490/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com