gpt4 book ai didi

java - 使用 Java 比较 Spark 中的两个数据帧?

转载 作者:太空宇宙 更新时间:2023-11-04 11:05:23 25 4
gpt4 key购买 nike

我有一个名为“sample_event”的表,看起来像

+-----+-------------------------+-------------------+---------------+
| id | log_timestamp | action_performed | activity_date |
+-----+-------------------------+-------------------+---------------+
| 1 | 2017-06-01 23:40:07.0 | Clicked | 2017-06-01 |
+-----+-------------------------+-------------------+---------------+

此表的架构与数据类型:-

 root
|-- id: integer (nullable = true)
|-- log_timestamp: timestamp (nullable = true)
|-- action_performed: string (nullable = true)
|-- activity_date: date (nullable = true)

我得到的数据框就像

Dataset<Row> df = sparkContext.sql("SELECT * FROM sample_event WHERE id=1")

我想通过使用表中相同的值创建一个新的数据框来测试数据框的值和类型。如何使用上述架构在 Java 中创建数据框?

最佳答案

创建表格

CREATE TABLE [IF NOT EXISTS] [db_name.]table_name1 LIKE [db_name.]table_name2 [LOCATION path]

使用现有表或 View 的定义/元数据创建 MANAGED 表。创建的表始终使用默认仓库位置中自己的目录。

关于java - 使用 Java 比较 Spark 中的两个数据帧?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46527895/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com