作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
<分区>
我将三个数据帧存储在列表 data_multi
中。这些数据帧中的每一个都具有相同的列名和相同的数据类型
列
>>> set(data_multi[0].columns) == set(data_multi[1].columns) == set(data_multi[2].columns)
True
dtypes(只显示一列)
>>> data_multi[0].select('aml_id_key_12739').dtypes
[('aml_id_key_12739', 'bigint')]
>>> data_multi[1].select('aml_id_key_12739').dtypes
[('aml_id_key_12739', 'bigint')]
>>> data_multi[2].select('aml_id_key_12739').dtypes
[('aml_id_key_12739', 'bigint')]
我复制了一个关于 SO 的帖子中提到的函数,它联合(rbinds)所有数据帧
def unionAll(*dfs):
return reduce(DataFrame.unionAll, dfs)
使用它,我将三个数据帧联合起来得到一个data_single = unionAll(*ddata_multi)
这是我面临的问题。每个数据帧中的 aml_id_key_12739
列是一个 'bigint'
但在并集之后它立即变成了一个 'double'
>>> pprint(data_single.select('aml_id_key_12739').dtypes)
[('aml_id_key_12739', 'double')]
因此,我的整个 id 列都乱七八糟。我忽略了什么?
我是一名优秀的程序员,十分优秀!