gpt4 book ai didi

python - 如何将整数数据表(来自 Python 数据表库)正确转换为 pandas Dataframe

转载 作者:行者123 更新时间:2023-12-05 01:35:20 29 4
gpt4 key购买 nike

我正在使用 Python 数据表 ( https://github.com/h2oai/datatable ) 读取仅包含整数值的 csv 文件。之后我将数据表转换为 pandas Dataframe。在转换时,仅包含 0/1 的列被视为 bool 值而不是整数。

让下面的 csv 文件 (small_csv_file_test.csv):

a1,a2,a3,a4,a5,a6,a7,a8,a9,a10 1, 1, 1, 1, 1, 1, 1, 0, 1, 1 2, 2, 2, 2, 2, 2, 2, 1, 0, 1 3, 3, 3, 3, 3, 3, 3, 0, 0, 1 4, 4, 4, 4, 4, 4, 4, 1, 0, 0 5, 5, 5, 5, 5, 5, 5, 0, 0, 0 6, 6, 6, 6, 6, 6, 6, 0, 0, 0 7, 7, 7, 7, 7, 7, 7, 1, 1, 0 8, 8, 8, 8, 8, 8, 8, 1, 1, 1 9, 9, 9, 9, 9, 9, 9, 1, 1, 1 0, 0, 0, 0, 0, 0, 0, 1, 0, 1

The source code :

import pandas as pd
import datatable as dt

test_csv_matrix = "small_csv_file_test.csv"

data = dt.fread(test_csv_matrix)
print(data.head(5))

matrix= data.to_pandas()
print(matrix.head())

结果:

   | a1  a2  a3  a4  a5  a6  a7  a8  a9  a10  -- + --  --  --  --  --  --  --  --  --  ---   0 |  1   1   1   1   1   1   1   0   1    1   1 |  2   2   2   2   2   2   2   1   0    1   2 |  3   3   3   3   3   3   3   0   0    1   3 |  4   4   4   4   4   4   4   1   0    0   4 |  5   5   5   5   5   5   5   0   0    0  

[5 行 x 10 列]

   a1  a2  a3  a4  a5  a6  a7     a8     a9    a10  0   1   1   1   1   1   1   1  False   True   True  1   2   2   2   2   2   2   2   True  False   True  2   3   3   3   3   3   3   3  False  False   True  3   4   4   4   4   4   4   4   True  False  False  4   5   5   5   5   5   5   5  False  False  False  

编辑 1:a8、a9 和 a10 列不正确,我希望它们是整数值而不是 bool 值。

感谢您的帮助。

最佳答案

您可以将每一列强制转换为 int64:

matrix = data.to_pandas().astype('int64')

关于python - 如何将整数数据表(来自 Python 数据表库)正确转换为 pandas Dataframe,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62996219/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com