gpt4 book ai didi

java - Weka StringToWordVector 过滤器可以使用哪些类型的文本文件

转载 作者:行者123 更新时间:2023-12-01 13:18:20 25 4
gpt4 key购买 nike

我知道文本文件应该转换为arff文件,但我很困惑文本文件中的内容是什么?它完全是一个字符串吗,比如“我是java”,或者像这样

@relation 

@attribute numerical
@attribute numerical

@data

文本内容“我是java”

最佳答案

您可以轻松地将包含实例(以原始数据形式)和特征(或属性)值(以列形式)的电子表格转换为 ARFF。 ARFF 文件的大部分由实例列表组成,每个实例的属性值以逗号分隔。大多数电子表格和数据库程序允许您将数据导出到逗号分隔值 (CSV) 格式的文件中,作为项目之间用逗号分隔的记录列表。完成此操作后,您只需将文件加载到文本编辑器或文字处理器中即可;使用@relation标签添加数据集的名称,使用@attribute添加属性信息,以及@data行;然后将文件另存为原始文本。或者在 WEKA 资源管理器中上传您的 csv 文件(预处理(以 csv 格式打开文件),然后将其另存为 arff。

关于java - Weka StringToWordVector 过滤器可以使用哪些类型的文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22275777/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com