作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试对两个数据帧中的每一行应用 pyspark sql 函数哈希算法来识别差异。哈希算法区分大小写。即如果列包含 'APPLE' 和 'Apple' 被视为两个不同的值,所以我想将两个数据帧的大小写更改为上限或下限。我只能实现数据帧标题,但不能实现数据帧值。请帮忙
#Code for Dataframe column headers
self.df_db1 =self.df_db1.toDF(*[c.lower() for c in self.df_db1.columns])
最佳答案
假设 df
是您的数据框,这应该可以完成以下工作:
from pyspark.sql import functions as F
for col in df.columns:
df = df.withColumn(col, F.lower(F.col(col)))
关于python-3.x - 如何将整个 pyspark 数据框的大小写更改为较低或较高,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48564337/
我是一名优秀的程序员,十分优秀!