gpt4 book ai didi

python - 用 pandas csv 读取的文本定义正确的分隔符

转载 作者:行者123 更新时间:2023-11-30 09:35:42 24 4
gpt4 key购买 nike

我一直在阅读有关使用 python 和 sklearn 进行机器学习的内容。我尝试使用 iris 数据集进行练习,然后继续在 UCI 网站上查找其他数据集。

我找到了一个叫做 "Amazon Book Reviews" .

文档说每个条目都用新行分隔,四个属性中的每一个都用空格“”分隔。

不幸的是,数据到处都包含空格,因为您有标题(文本)和描述(html)。

当我尝试使用 panda csv_read 函数时,它当然不知道在哪里分隔列,我也不知道。

有什么想法吗?对于机器学习(以及一般的编程)初学者来说,我是否太超出了我的能力范围?

最佳答案

你没有做错任何事,文档实际上是不正确的。数据文件中使用的分隔符实际上是制表符'\t' 字符。您可以将其用作 pandas.read_csvdelimiter 参数。

祝您分析顺利!

关于python - 用 pandas csv 读取的文本定义正确的分隔符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43265483/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com