gpt4 book ai didi

python - 在 .csv 文件中读取时,我似乎无法指定列数据类型

转载 作者:太空宇宙 更新时间:2023-11-04 04:45:31 25 4
gpt4 key购买 nike

<分区>

菜鸟问题(已修订):我读入了一个 .csv 文件,并尝试按以下方式指定数据类型:

import csv
import pandas as pd

cdc = pd.read_csv('myFile.csv',
dtype = {
'Phenotype': str,
'State': str,
'EventType': str,
'EventYear': str,
'AgeCategory': str,
'NumberTested' : str,
'NumberResistant': str,
'PercentResistant': str
})

但是在阅读 df 文件后,我得到:

df.dtypes

Phenotype object
State object
EventType object
EventYear object
AgeCategory object
NumberResistant object
PercentResistant object
dtype: object

我想我会为每一列获取字符串的数据类型。

我希望每一列都被读取为一个字符串,因为有些列混合了数字和字符串,您将在下面的 .csv 示例文件中看到。一旦文件被读入,我就可以开始操作这该死的东西了!

底线:我想清理数据行并将“未测试”和“未定义”替换为 NaN 或零。无论如何,我不能用“对象”来做到这一点。

仅供引用,我在 .csv 中读取了一个没有“dtype”参数的 df,但我遇到了同样的问题。在读取没有指定数据类型的文件后,我尝试从现有列创建一个新的整数列,但“对象”数据类型似乎也妨碍了这一点。

我卡住了。我环顾四周,似乎无法自己弄清楚。

示例输入 .csv 文件:(行与行之间没有多余的行,我只是想让行更易读)

Phenotype,State,EventType,EventYear,AgeCategory,NumberTested,NumberResistant,PercentResistant

Acinetobacter,AK,All HAIs,2011, 1-18,2,1,0.5

Acinetobacter,AK,CAUTI,2011, 1-18,0,None Tested,Not Defined

Acinetobacter,AK,CLABSI,2011, 1-18,0,None Tested,Not Defined

Acinetobacter,AK,SSI,2011, 1-18,0,None Tested,Not Defined

Acinetobacter,AK,All HAIs,2011,<1,2,2,1.0

Acinetobacter,AK,CAUTI,2011,<1,0,None Tested,Not Defined

Acinetobacter,AK,CLABSI,2011,<1,0,None Tested,Not Defined

Acinetobacter,AK,SSI,2011,<1,0,None Tested,Not Defined

Acinetobacter,AK,All HAIs,2011,19-64,(1-19),Insufficient Data,Insufficient Data

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com