python - 值错误: Length of object (3) does not match with length of fields-6ren

python - 值错误: Length of object (3) does not match with length of fields

转载作者：太空宇宙更新时间：2023-11-03 14:32:36

24

4

我手动创建 PySpark DataFrame 如下:

acdata = sc.parallelize([ 
[('timestamp', 1506340019), ('pk', 111), ('product_pk', 123), ('country_id', 'FR'), ('channel', 'web')]
])
# Convert to tuple
acdata_converted = acdata.map(lambda x: (x[0][1], x[1][1], x[2][1]))

# Define schema
acschema = StructType([
    StructField("timestamp", LongType(), True),
    StructField("pk", LongType(), True),
    StructField("product_pk", LongType(), True),
    StructField("country_id", StringType(), True),
    StructField("channel", StringType(), True)
])

df = sqlContext.createDataFrame(acdata_converted, acschema)

但是当我编写 df.head() 并执行 spark-submit 时，出现以下错误:

org.apache.spark.api.python.PythonException: Traceback (most recent call last):
  File "/mnt/yarn/usercache/hdfs/appcache/application_1510134261242_0002/container_1510134261242_0002_01_000003/pyspark.zip/pyspark/worker.py", line 177, in main
    process()
  File "/mnt/yarn/usercache/hdfs/appcache/application_1510134261242_0002/container_1510134261242_0002_01_000003/pyspark.zip/pyspark/worker.py", line 172, in process
    serializer.dump_stream(func(split_index, iterator), outfile)
  File "/mnt/yarn/usercache/hdfs/appcache/application_1510134261242_0002/container_1510134261242_0002_01_000003/pyspark.zip/pyspark/serializers.py", line 268, in dump_stream
    vs = list(itertools.islice(iterator, batch))
  File "/mnt/yarn/usercache/hdfs/appcache/application_1510134261242_0002/container_1510134261242_0002_01_000001/pyspark.zip/pyspark/sql/session.py", line 520, in prepare
  File "/mnt/yarn/usercache/hdfs/appcache/application_1510134261242_0002/container_1510134261242_0002_01_000003/pyspark.zip/pyspark/sql/types.py", line 1358, in _verify_type
    "length of fields (%d)" % (len(obj), len(dataType.fields)))
ValueError: Length of object (3) does not match with length of fields (12)

    at org.apache.spark.api.python.PythonRunner$$anon$1.read(PythonRDD.scala:193)
    at org.apache.spark.api.python.PythonRunner$$anon$1.<init>(PythonRDD.scala:234)
    at org.apache.spark.api.python.PythonRunner.compute(PythonRDD.scala:152)
    at org.apache.spark.api.python.PythonRDD.compute(PythonRDD.scala:63)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)
    at org.apache.spark.rdd.MapPartitionsRDD.compute(MapPartitionsRDD.scala:38)
    at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:323)
    at org.apache.spark.rdd.RDD.iterator(RDD.scala:287)
    at org.apache.spark.scheduler.ResultTask.runTask(ResultTask.scala:87)
    at org.apache.spark.scheduler.Task.run(Task.scala:108)
    at org.apache.spark.executor.Executor$TaskRunner.run(Executor.scala:335)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)

这是什么意思以及如何解决？

最佳答案

您需要映射所有 5 个字段以与定义的架构匹配。

    acdata_converted = acdata.map(lambda x: (x[0][1], x[1][1], x[2][1], x[3][1], x[4][1]))

关于python - 值错误: Length of object (3) does not match with length of fields，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47177112/

24

4

0

文章推荐： c# - 有没有办法在 WCF 中实现核心代码模板？

文章推荐： c# - 调用 TLS 1.0 和 TLS 1.2 Web 服务的 ASP.NET 应用程序

python - "length and length"与 Python 中的 "length"有什么不同吗？
我找到了以下代码片段: length = length and length or len(string) 在我看来，这应该等同于: length = length or len(string) 我能
python - 一维数组形状 (length,) vs. (length,1) vs. (length)
当我使用 numpy.shape() 检查数组的形状时，我有时会得到 (length,1) 有时会得到 (length,)。看起来区别在于列向量与行向量......但它似乎并没有改变数组本身的任何内容
java - 在 Java 中这是什么意思 "length >= 0 ? length : length * -1"
我正在学习 Java，有一个简单的问题。在设置类的示例中，我看到了这一点: length >= 0 ? length : length * -1 这是什么意思？谢谢。最佳答案这是一种骇人听闻的
ruby - Ruby 的 length 方法是一个符号吗？为什么是:length sometimes the same as length?
我在阅读有关在 Ruby 中重新定义方法有多么容易的文章时遇到了以下问题: class Array alias :old_length :length def length old_l
java - .length() 与 .getText().length() 与 .getText().toString().length()
例如在下面的代码中a和b和c是相等的。 EditText editText; editText = (EditText) findViewById(R.id.edttxt); editText.set
javascript - 为什么 `Array.length` 、 `Function.length` 、 `String.length` 等返回 1？
在昨天教授我的 JavaScript 类(class)时，我和我的学生遇到了一些有趣的功能，我认为这些功能可能值得在一个问题和我得出的答案中捕捉到。在 Chrome 的 JS 控制台中输入 Arra
java - 何时使用 .length 与 .length()
这个问题在这里已经有了答案: How can I get the size of an array, a Collection, or a String in Java? (3 个回答) 3年前关闭。
java - length 和 length() 有什么区别？
这个问题在这里已经有了答案: length and length() in Java (8 个答案) 关闭 6 年前。我注意到在计算数组的长度时，你会这样写: arrayone.length; 但
angular - this.slides.length() 无法读取未定义的属性 'length'
console.log(this.slides.length()); 打印 Cannot read property 'length' of undefined.在 setTimeout 为 100
r - 从CRAN安装软件包时警告 “downloaded length != reported length”
在搜索stackoverflow问题时，我发现了此链接: Error in file.download when downloading custom file。但是，我的情况有些不同(我认为):
r - seq(...) 参数 "length.out"与 "length"
这个问题已经有答案了: Why does R use partial matching? (1 个回答) 已关闭 8 年前。大家。我刚刚开始使用 swirl 学习 R 编程。我刚刚了解到seq 。
r - seq(...) 参数 "length.out"与 "length"
这个问题已经有答案了: Why does R use partial matching? (1 个回答) 已关闭 8 年前。大家。我刚刚开始使用 swirl 学习 R 编程。我刚刚了解到seq 。
java - 使用 .length 和 .length() 求长度有什么区别
这个问题已经有答案了: How can I get the size of an array, a Collection, or a String in Java? (3 个回答) 已关闭 9 年前。
javascript - 在没有 length 属性的变量上使用 .length 会导致崩溃
我有一个大数组，其中包含所有类型( bool 值，数组，null，...)，并且我正在尝试访问它们的属性arr[i].length，但有些其中显然没有长度。我不介意那些缺少长度的人是否返回未定义(我
javascript 测试 .length 和 .length > 0
我在对象的属性中有一些文本。我正在测试对象的属性中是否有要显示的文本；如果没有，那么我显示“-”而不是空白。看起来没有什么区别: if (MyObject.SomeText && MyObject.S
java - String.length() 与 Array.length
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Why is String.length() a method? Java - Array's length
javascript - (obj.length === +obj.length) 比较什么？
这个问题在这里已经有了答案: obj.length === +obj.length in javascript (4 个答案) 关闭 9 年前。我一直在读underscore.js源代码并在 _.
c++ - 两个单词的长度相加产生错误答案(string0.length() + string1.length())
#include using std::cout; using std::cin; using std::string; int main(){ cout > name; cout
javascript - obj.length 什么时候不等于+obj.length？
我正在细读 underscore.js annotated source当我遇到这个时: if (obj.length === +obj.length) {...} 我现在从this stackove
c# - (args 之间的区别是 { Length : > 0}) and args. Length?
我正在查看 dotnet 运行时中的一些代码，我注意到不是这样写的: if (args.Length > 0) 他们使用这个: if (args is { Length: > 0}) 你知道用第二种方

首页

博学

6Ren·AI

商城

python - 值错误: Length of object (3) does not match with length of fields