gpt4 book ai didi

google-cloud-nl - Google AutoML 自然语言多标签文本分类的输入数据集格式

转载 作者:行者123 更新时间:2023-12-04 01:52:02 25 4
gpt4 key购买 nike

对于 Google AutoML Natural Language 多标签文本分类,输入数据集的格式应该是什么?我知道对于多类分类,我需要一列文本和另一列标签。标签列每行包含一个标签。

我每个文本都有多个标签,我想做多标签分类。我尝试为每个标签设置一列和单热编码,但我收到此错误消息:最多支持 1000 个标签。找到 9823 个标签。

最佳答案

一开始很困惑,但后来我设法在文档中找到了格式,这是一个 CSV 文件,如:

文本 1、标签 1、标签 2
文本 2,标签 2
文本 3、标签 3、标签 2、标签 1

解析器无法理解将 NULL 单元格保存为标准 CSV 文件的表格,例如:

text1, label1, label2,
文本 2、标签 2、、
文本 3、标签 3、标签 2、标签 1

我不得不从 Pandas 生成的 CSV 文件中手动删除多余的逗号。

关于google-cloud-nl - Google AutoML 自然语言多标签文本分类的输入数据集格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52558137/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com