gpt4 book ai didi

python - 类型错误: 'DataFrame' 对象不可调用 - Spark 数据框

转载 作者:行者123 更新时间:2023-12-01 21:58:04 25 4
gpt4 key购买 nike

我在执行提到的“join”语句时出现以下错误。我正在使用 pyspark 设置。连接语句或代码中需要的任何更改。

TypeError: 'DataFrame' 对象不可调用

df11 = spark.read.option("header","true").option("delimiter", ",").csv("s3://mybucket/file1.csv")
df22 = spark.read.option("header","true").option("delimiter", ",").csv("s3://mybucket/file2.csv")
df11.createOrReplaceTempView("table1")
df22.createOrReplaceTempView("table2")
df1 = spark.sql( "select * from table1" )
df2 = spark.sql( "select * from table2" )

df_d = df1.join(df2, df1.NO == df2.NO, 'left').filter(F.isnull(df2.NO)).select(df1.NO,df1.NAME,df1.LAT,df1.LONG, F.lit('DELETE').alias('FLAG'))

谢谢

最佳答案

像这样使用col名称作为字符串,它应该可以工作

df_d = df1.join(df2, df1['NO'] == df2['NO'], 'left').filter(F.isnull(df2['NO'])).select(df1['NO'],df1['NAME'],df1['LAT'],df1['LONG'], F.lit('DELETE').alias('FLAG'))

关于python - 类型错误: 'DataFrame' 对象不可调用 - Spark 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55240023/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com