gpt4 book ai didi

python - 文本数据存储方式不同

转载 作者:太空宇宙 更新时间:2023-11-03 21:14:30 28 4
gpt4 key购买 nike

我的问题是我有两个应该相同的值,但是它们有这种奇怪的差异,我不知道它来自哪里。

上下文是我使用 pd.read_csv 导入了 3 个文件。我使用 groupby 对值进行分组,使用一些日期字段,并使用 nunique 聚合有问题的变量,只是为了记录计数。

然后,使用 Tableau 实际上计算了不同数量的唯一记录。我发现 pandas 认为两条记录不同,而 Tableau 认为是相等的。

看一下:

df
A
0 100000306
1 100000306

x1 = df.iloc[0,0]
str(x1.values)
"['100000306']"

x2 = df.iloc[1,0]
str(x2.values)
'[100000306]'

为什么会发生这种情况?我该怎么做才能让 pandas 知道它们具有相同的值?

最佳答案

您在一列中有不同的类型

df.applymap(type)
A
0 <class 'str'>
1 <class 'int'>

请注意,当您打印 df.A 时,它将显示对象

df.A
0 100000306
1 100000306
Name: A, dtype: object

关于python - 文本数据存储方式不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54818101/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com