dataframe - 可空字段在写入 Spark Dataframe 时发生更改-6ren

dataframe - 可空字段在写入 Spark Dataframe 时发生更改

转载作者：行者123 更新时间：2023-12-05 01:45:53

26

4

以下代码从 parquet 文件读取 Spark DataFrame 并写入另一个 parquet 文件。在将 DataFrame 写入新的 Parquet 文件后，ArrayType DataType 中的 Nullable 字段发生更改。

代码:

    SparkConf sparkConf = new SparkConf();
    String master = "local[2]";
    sparkConf.setMaster(master);
    sparkConf.setAppName("Local Spark Test");
    JavaSparkContext sparkContext = new JavaSparkContext(new SparkContext(sparkConf));
    SQLContext sqc = new SQLContext(sparkContext);
    DataFrame dataFrame = sqc.read().parquet("src/test/resources/users.parquet");
    StructField[] fields = dataFrame.schema().fields();
    System.out.println(fields[2].dataType());
    dataFrame.write().mode(SaveMode.Overwrite).parquet("src/test/resources/users1.parquet");


    DataFrame dataFrame1 = sqc.read().parquet("src/test/resources/users1.parquet");
    StructField [] fields1 = dataFrame1.schema().fields();
    System.out.println(fields1[2].dataType());

输出:

ArrayType(IntegerType,false)
ArrayType(IntegerType,true)

Spark 版本为:1.6.2

最佳答案

对于 Spark 2.4 或之前的版本，所有从 spark sql 写入的列都是可以为空的。引用 the official guide

Parquet is a columnar format that is supported by many other data processing systems. Spark SQL provides support for both reading and writing Parquet files that automatically preserves the schema of the original data. When writing Parquet files, all columns are automatically converted to be nullable for compatibility reasons.

关于dataframe - 可空字段在写入 Spark Dataframe 时发生更改，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39697193/

26

4

0

文章推荐： makefile - Makefile 中的随机访问数组

文章推荐： elixir - 重定向后 Flash 会保留，但常规分配不会

文章推荐： ssrs-2008-r2 - 不返回任何数据的 SSRS 2008 R2 子报表不会显示

java - JGroups:发送(空，空，消息)与发送(地址，空，消息)
我已经为使用 JGroups 编写了简单的测试。有两个像这样的简单应用程序 import org.jgroups.*; import org.jgroups.conf.ConfiguratorFact
javascript - 空/空 json 如何检查它而不输出？
我有一个通过 ajax 检索的 json 编码数据集。我尝试检索的一些数据点将返回 null 或空。但是，我不希望将那些 null 或空值显示给最终用户，或传递给其他函数。我现在正在做的是检查
c# - 如果(值==空)与如果(空==值)
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: Why does one often see “null != variable” instead of “
java - 如果(空!=变量)为什么不如果(变量!=空)
嗨在我们公司，他们遵循与空值进行比较的严格规则。当我编码 if(variable!=null) 在代码审查中，我收到了对此的评论，将其更改为 if(null!=variable)。上面的代码对性能有影
typescript - Cordova 插件-qrscanner : error: no suitable constructor found for DefaultDecoderFactory(ArrayList, <空>，<空>)
我正在尝试使用 native Cordova QR 扫描仪插件编译项目，但是我不断收到此错误。据我了解，这是代码编写方式的问题，它向构造函数发送了错误的值，或者根本就没有找到构造函数。那么我该如何解决
Apache Nutch 错误 : Injector: java. io.IOException:命令字符串中的(空)条目:空 chmod 0644
我在装有 Java 1.8 的 Windows 10 上使用 Apache Nutch 1.14。我已按照 https://wiki.apache.org/nutch/NutchTutorial 中提
SQL为空且=空
这个问题已经有答案了: 已关闭11 年前。 Possible Duplicate: what is “=null” and “ IS NULL” Is there any difference bet
空-三眼乌鸦
Three-EyedRaven 内网渗透初期，我们都希望可以豪无遗漏的尽最大可能打开目标内网攻击面，故，设计该工具的初衷是解决某些工具内网探测速率慢、运行卡死、服务爆破误报率高以及socks流
Scala-空(？)作为命名Int参数的默认值
我想在Scala中像在Java中那样做: public void recv(String from) { recv(from, null); } public void recv(String
python - 空/无SIFT描述符和在python中生成的关键点
我正在尝试从一组图像补丁中创建一个密码本。我已将图像(Caltech 101)分成20 X 20图像块。我想为每个补丁创建一个SIFT描述符。但是对于某些图像补丁，它不返回任何描述符/关键点。我尝试使
spring - @Autowire注释的问题(空)
我在验证器类中自动连接的两个服务有问题。这些服务工作正常，因为在我的 Controller 中是自动连接的。我有一个 applicationContext.xml 文件和 MyApp-servlet.
java - 空 while 循环的线程问题
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。已关闭10 年前。问题必须表现出对要解决的问题的最低程度的了解。告诉我们您尝试过做什么，为什么不起作用，以
php - mysql_num_rows 空
大家好，我正在对数据库进行正常的选择，但是 mysql_num_rowsis 为空，我不知道为什么，我有 7 行选择。如果您发现问题，请告诉我。真的谢谢。代码如下: function get_b
ios - 打印出连接的字符串显示(空)
我想以以下格式创建一个字符串:id[]=%@&stringdata[]=%@&id[]=%@&stringdata[]=%@&id[]=%@&stringdata[]=%@&等，在for循环中，我得到
ios - stringWithContentsOfURL返回(空)
我正在尝试使用以下代码将URL转换为字符串: NSURL *urlOfOpenedFile = _service.myURLRequest.URL; NSString *fileThatWasOpen
iphone - 将UInt32传递给NSData对象返回(空)
我正在尝试将NSNumber传递到正在工作的UInt32中。然后，我试图将UInt32填充到NSData对象中。但是，这在这里变得有些时髦... 当我尝试将NSData对象中的内容写成它返回的字符串(
java - 服务器cookie=空
我正在进行身份验证并收到空 cookie。我想存储这个 cookie，但服务器没有返回给我 cookie。但响应代码是 200 ok。 httpConn.setRequestProperty(
java - 简单的菜鸟应用程序每次都会崩溃..(空)？
我认为 Button bTutorial1 = (Button) findViewById(R.layout.tutorial1); bTutorial1.setOnClickListener
jsp - 如何在JSTL中查找HashMap是否为空/空？
我的 Controller 中有这样的东西: model.attribute("hiringManagerMap",hiringManagerMap); 我正在访问此 hiringManagerMap
jQuery 空() ListView
我想知道如何以正确的方式清空列表。在 div 中有一个列表然后清空 div 或列表更好吗？我知道这是一个蹩脚的问题，但请帮助我理解这个 empty() 函数:) 案例)如果我运行这个脚本会发生什么:

首页

博学

6Ren·AI

商城

dataframe - 可空字段在写入 Spark Dataframe 时发生更改