gpt4 book ai didi

python - pandas read_csv 列 dtype 设置为十进制但转换为字符串

转载 作者:太空狗 更新时间:2023-10-29 20:58:10 24 4
gpt4 key购买 nike

我正在使用 pandas (v0.18.1) 从名为“test.csv”的文件中导入以下数据:

a,b,c,d
1,1,1,1.0

我已将“c”和“d”列的 dtype 设置为“decimal.Decimal”,但它们返回为“str”类型。

import pandas as pd
import decimal as D

df = pd.read_csv('test.csv', dtype={'a': int, 'b': float, 'c': D.Decimal, 'd': D.Decimal})

for i, v in df.iterrows():
print(type(v.a), type(v.b), type(v.c), type(v.d))

结果:

`<class 'int'> <class 'float'> <class 'str'> <class 'str'>`

我也曾尝试在导入后显式转换为十进制,但没有成功(转换为 float 有效但不是十进制)。

df.c = df.c.astype(float)
df.d = df.d.astype(D.Decimal)
for i, v in df.iterrows():
print(type(v.a), type(v.b), type(v.c), type(v.d))

结果:

`<class 'int'> <class 'float'> <class 'float'> <class 'str'>`

以下代码将“str”转换为“decimal.Decimal”,所以我不明白为什么 pandas 的行为方式不同。

x = D.Decimal('1.0')
print(type(x))

结果:

`<class 'decimal.Decimal'>`

最佳答案

我认为你需要转换器:

import pandas as pd
import io
import decimal as D

temp = u"""a,b,c,d
1,1,1,1.0"""

# after testing replace io.StringIO(temp) to filename
df = pd.read_csv(io.StringIO(temp),
dtype={'a': int, 'b': float},
converters={'c': D.Decimal, 'd': D.Decimal})

print (df)
a b c d
0 1 1.0 1 1.0

for i, v in df.iterrows():
print(type(v.a), type(v.b), type(v.c), type(v.d))

<class 'int'> <class 'float'> <class 'decimal.Decimal'> <class 'decimal.Decimal'>

关于python - pandas read_csv 列 dtype 设置为十进制但转换为字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38114654/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com