gpt4 book ai didi

python - 是否可以查看 pytorchtext.data.Tabulardataset 的读取数据?

转载 作者:行者123 更新时间:2023-11-30 09:47:07 27 4
gpt4 key购买 nike

train, test = data.TabularDataset.splits(path="./data/", train="train.csv",test="test.csv",format="csv",fields=[("Tweet",TEXT), ("Affect Dimension",LABEL)])

我有这段代码,想要评估加载的数据是否正确,或者是否在实际文本字段中使用了错误的列等。

如果我的文件的文本有“Tweet”列,类名称有“Affect Dimension”列,那么将它们像字段部分一样放置是否正确?

编辑:TabularDataset 包含一个示例对象,可以读取其中的数据。读取 csv 文件时,仅接受“,”作为分隔符。其他一切都会导致数据损坏。

最佳答案

无论您的文件有什么内容,您都可以输入任何字段名称。另外,我建议不要在字段名称中使用空格。

因此,将 Affect Dimension 重命名为 Affect_Dimension 或任何您方便的名称。

然后您可以像下面这样迭代不同的字段来检查读取的数据。

for i in train.Tweet:
print i
for i in train.Affect_Dimension:
print i

for i in test.Tweet:
print i
for i in test.Affect_Dimension:
print i

关于python - 是否可以查看 pytorchtext.data.Tabulardataset 的读取数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51183040/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com