作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我是 pyspark 的新手。我正在使用数据 block 运行 pyspark。我的数据存储在 Azure Data Lake Service 中。我正在尝试将 csv 文件从 ADLS 读取到 pyspark 数据框。所以我写了下面的代码
import pyspark
from pyspark import SparkContext
from pyspark import SparkFiles
df = sqlContext.read.csv(SparkFiles.get("dbfs:mycsv path in ADSL/Data.csv"),
header=True, inferSchema= True)
但是我收到错误信息
Py4JJavaError: An error occurred while calling o389.csv.
你能建议我纠正这个错误吗?
最佳答案
SparkFiles
类用于访问作为 Spark 作业的一部分提供的文件。如果您只需要访问 ADLS 上可用的 CSV 文件,则只需使用 spark.read.csv
,例如:
df = spark.read.csv("dbfs:mycsv path in ADSL/Data.csv",
header=True, inferSchema=True)
最好不要使用sqlContext
,它是出于兼容性原因保留的。
关于apache-spark - Py4JJavaError : An error occurred while calling o389..csv,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64207977/
我是一名优秀的程序员,十分优秀!