gpt4 book ai didi

python - 使用 Pandas 导入数据文件时,为什么列中的数字被省略

转载 作者:行者123 更新时间:2023-12-01 00:41:05 26 4
gpt4 key购买 nike

我正在尝试使用 pandas 从 csv 形式的 github 站点导入数据。它似乎工作正常,只是“ZIP”列没有导入所有数字。邮政编码应该有 5 位数字,但似乎省略了前面的 1 或 2 位数字。为什么?!

我要导入this数据:

coords=pd.read_csv('https://gist.githubusercontent.com/erichurst/7882666/raw/5bdc46db47d9515269ab12ed6fb2850377fd869e/US%2520Zip%2520Codes%2520from%25202013%2520Government%2520Data')
coords.head(5)

出于某种原因,它看起来像这样,但邮政编码应该是00601

    ZIP     LAT         LNG
0 601 18.180555 -66.749961

最佳答案

原因是因为 pandas 会自动推断列的 dtype 并最终为 ZIP 列分配 integer dtype,因为它仅由数字组成。

您必须明确声明它们是字符串,否则 00601 将只是 601

您可以通过使用 read_csv 中的dtypes 参数来实现此目的

pd.read_csv(file, dtype={'ZIP': str})

关于python - 使用 Pandas 导入数据文件时,为什么列中的数字被省略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57342614/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com