- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在使用 spark(scala) 在 Apache Hudi
上进行 POC。
我在使用分区保存数据帧时遇到问题。
Hudi 使用 path/valueOfPartitionCol1/valueOfPartitionCol2.... 保存数据框....
使用属性 PARTITIONPATH_FIELD_OPT_KEY
。
但我的要求是 path/COL1=value/COL2=value....
类似于 spark 使用 partitionBy()
对数据进行分区的方式。
任何尝试过使用 Hudi
进行自定义分区的人都可以帮助我吗?
最佳答案
这有帮助吗?设置配置 HIVE_STYLE_PARTITIONING_OPT_KEY=true 如下:
batchDF.write.format("org.apache.hudi")
.option(HIVE_STYLE_PARTITIONING_OPT_KEY, true)
.mode(SaveMode.Append)
.save(bathPath)
关于apache-spark - 具有自定义格式的 Apache Hudi 分区,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59356613/
我正在使用 Apache Hudi 将非分区表写入 AWS S3 并将其同步到配置单元。这是正在使用的 DataSourceWriteOptions。 val hudiOptions: Map[Str
我目前正在使用 spark(scala) 在 Apache Hudi 上进行 POC。 我在使用分区保存数据帧时遇到问题。 Hudi 使用 path/valueOfPartitionCol1/valu
我试图在 AWS EMR 上运行 Hudi deltastreamer。按照此博客中的步骤操作。 https://cwiki.apache.org/confluence/pages/viewrecen
场景: 使用 saveAsTable(data frame writer) 存储 Hudi Spark 数据帧方法,使得 Hudi 支持表 org.apache.hudi.hadoop.HoodieP
我正在研究几种“事务性数据湖”技术,例如 Apache Hudi、Delta Lake、AWS Lake Formation Governed Tables。 除了后者,我看不出这些在多集群环境中如何
我是一名优秀的程序员,十分优秀!