gpt4 book ai didi

python - 使用 loadtxt 读取带有字符串和 float 的文件

转载 作者:行者123 更新时间:2023-11-28 23:03:20 25 4
gpt4 key购买 nike

我需要读取 this page 上可用的数据集用 python 。

他们非常精确地定义了每一列的数据类型。我如何使用 loadtxt(它是一个 numpy 函数)来读取这个数据集。我尝试在 dtype 选项中提供数据类型,但没有成功。

最佳答案

您链接的站点中的表格彼此非常不同,并且您在不同的列中有不同的类型。

您需要为每个表定义一个记录类型
记录类型允许您在同一个数组上声明字符串、整数和 float 。它的定义和使用方式如下例所示:

>>> recordtype = dtype([('name', str_, 20), ('age', int32), ('weight', float32)])
>>> people = array([('Joaquin', 51, 60.0), ('Cat', 18, 8.6)], dtype=recordtype)
>>> people
array([('Joaquin', 51, 60.0), ('Cat', 18, 8.600000381469727)], dtype=[('name', '<U20'), ('age', '<i4'), ('weight', '<f4')])

另一方面,您有一些行的内容如 '...' 破坏了其中数据的连贯性。因此,如果您需要直接从文件中读取,则需要为 loadtxt 转换器参数使用转换器函数。

或者,由于 loadtext 也接受一个生成器作为输入,您可以在生成器中处理行并使用经过清理的行来提供 loadtext。

最后你还应该设置skiprows参数来消除表格标题

关于python - 使用 loadtxt 读取带有字符串和 float 的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8624217/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com