scala - 使用 Datastax 的 Spark Cassandra Connector 在 TableDef 上设置 Cassandra 聚类顺序-6ren

scala - 使用 Datastax 的 Spark Cassandra Connector 在 TableDef 上设置 Cassandra 聚类顺序

转载作者：行者123 更新时间：2023-12-04 00:59:01

每次我尝试使用新的 TableDef 在 cassandra 中创建一个新表时，我都会以升序的聚类顺序结束，并尝试降序。

我使用的是 Cassandra 2.1.10、Spark 1.5.1 和 Datastax Spark Cassandra Connector 1.5.0-M2。

我正在创建一个新的 TableDef

val table = TableDef("so", "example", 
  Seq(ColumnDef("parkey", PartitionKeyColumn, TextType)),
  Seq(ColumnDef("ts", ClusteringColumn(0), TimestampType)),
  Seq(ColumnDef("name", RegularColumn, TextType)))

rdd.saveAsCassandraTableEx(table, SomeColumns("key", "time", "name"))

我期望在 Cassandra 中看到的是

CREATE TABLE so.example (
    parkey text,
    ts timestamp,
    name text,
    PRIMARY KEY ((parkey), ts)
) WITH CLUSTERING ORDER BY (ts DESC);

我最终得到的是

CREATE TABLE so.example (
    parkey text,
    ts timestamp,
    name text,
    PRIMARY KEY ((parkey), ts)
) WITH CLUSTERING ORDER BY (ts ASC);

如何强制将聚类顺序设置为降序？

最佳答案

我无法找到执行此操作的直接方法。此外，您可能还需要指定许多其他选项。我最终扩展了 ColumnDef 和 TableDef 并覆盖了 TableDef 中的 cql 方法。下面是我提出的解决方案示例。如果有人有更好的方法或者这成为 native 支持，我很乐意更改答案。

// Scala Enum
object ClusteringOrder {
  abstract sealed class Order(val ordinal: Int) extends Ordered[Order]
    with Serializable {
    def compare(that: Order) = that.ordinal compare this.ordinal

    def toInt: Int = this.ordinal
  }

  case object Ascending extends Order(0)
  case object Descending extends Order(1)

  def fromInt(i: Int): Order = values.find(_.ordinal == i).get

  val values = Set(Ascending, Descending)
}

// extend the ColumnDef case class to add enum support
class ColumnDefEx(columnName: String, columnRole: ColumnRole, columnType: ColumnType[_],
  indexed: Boolean = false, val clusteringOrder: ClusteringOrder.Order = ClusteringOrder.Ascending)
  extends ColumnDef(columnName, columnRole, columnType, indexed)

// Mimic the ColumnDef object
object ColumnDefEx {
  def apply(columnName: String, columnRole: ColumnRole, columnType: ColumnType[_],
    indexed: Boolean, clusteringOrder: ClusteringOrder.Order): ColumnDef = {
    new ColumnDefEx(columnName, columnRole, columnType, indexed, clusteringOrder)
  }

  def apply(columnName: String, columnRole: ColumnRole, columnType: ColumnType[_],
    clusteringOrder: ClusteringOrder.Order = ClusteringOrder.Ascending): ColumnDef = {
    new ColumnDefEx(columnName, columnRole, columnType, false, clusteringOrder)
  }

  // copied from ColumnDef object
  def apply(column: ColumnMetadata, columnRole: ColumnRole): ColumnDef = {
    val columnType = ColumnType.fromDriverType(column.getType)
    new ColumnDefEx(column.getName, columnRole, columnType, column.getIndex != null)
  }
}

// extend the TableDef case class to override the cql method
class TableDefEx(keyspaceName: String, tableName: String, partitionKey: Seq[ColumnDef],
  clusteringColumns: Seq[ColumnDef], regularColumns: Seq[ColumnDef], options: String)
  extends TableDef(keyspaceName, tableName, partitionKey, clusteringColumns, regularColumns) {

  override def cql = {
    val stmt = super.cql
    val ordered = if (clusteringColumns.size > 0)
      s"$stmt\r\nWITH CLUSTERING ORDER BY (${clusteringColumnOrder(clusteringColumns)})"
    else stmt
    appendOptions(ordered, options)
  }

  private[this] def clusteringColumnOrder(clusteringColumns: Seq[ColumnDef]): String =
    clusteringColumns.map { col =>
      col match {
        case c: ColumnDefEx => if (c.clusteringOrder == ClusteringOrder.Descending)
          s"${c.columnName} DESC" else s"${c.columnName} ASC"
        case c: ColumnDef => s"${c.columnName} ASC"
      }
    }.toList.mkString(", ")

  private[this] def appendOptions(stmt: String, opts: String) =
    if (stmt.contains("WITH") && opts.startsWith("WITH")) s"$stmt\r\nAND ${opts.substring(4)}"
    else if (!stmt.contains("WITH") && opts.startsWith("AND")) s"WITH ${opts.substring(3)}"
    else s"$stmt\r\n$opts"
}

// Mimic the TableDef object but return new TableDefEx
object TableDefEx {
  def apply(keyspaceName: String, tableName: String, partitionKey: Seq[ColumnDef],
    clusteringColumns: Seq[ColumnDef], regularColumns: Seq[ColumnDef], options: String = "") =
    new TableDefEx(keyspaceName, tableName, partitionKey, clusteringColumns, regularColumns,
      options)

  def fromType[T: ColumnMapper](keyspaceName: String, tableName: String): TableDef =
    implicitly[ColumnMapper[T]].newTable(keyspaceName, tableName)
}

这允许我以这种方式创建新表:

val table = TableDefEx("so", "example", 
  Seq(ColumnDef("parkey", PartitionKeyColumn, TextType)),
  Seq(ColumnDefEx("ts", ClusteringColumn(0), TimestampType, ClusteringOrder.Descending)),
  Seq(ColumnDef("name", RegularColumn, TextType)))

rdd.saveAsCassandraTableEx(table, SomeColumns("key", "time", "name"))

关于scala - 使用 Datastax 的 Spark Cassandra Connector 在 TableDef 上设置 Cassandra 聚类顺序，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33445964/

文章推荐： ajax - 并发 AJAX 间隔轮询

文章推荐： windows-7 - IntelliJ 是否以管理员权限启动进程？

文章推荐： asp.net-mvc - 服务层与业务层 - 区别？

ms-access - 如何在 TableDefs 中搜索链接表？
循环遍历一组 TableDef，如何确定每个 TableDef 是否代表链接表，而不是本地表？最佳答案对于链接表，TableDef.Connect属性包含连接信息。但是对于原生表，.Connect
servicestack - 从 SqlExpression 获取 tableDefs
我有一个方法，其参数为 SqlExpression .该方法基本上采用 OrmLite 查询并对其执行一些从字符串输入生成的查询。我真的需要能够从 SqlExpression 获取查询的所有表类型所
ms-access - 在 VBA 中更改 tabledef .connect 属性
我正在尝试做我做过一百次的事情，但它突然不起作用。 acc.AutomationSecurity = msoAutomationSecurityLow 'Remove Security Promp
scala - 使用 Datastax 的 Spark Cassandra Connector 在 TableDef 上设置 Cassandra 聚类顺序
每次我尝试使用新的 TableDef 在 cassandra 中创建一个新表时，我都会以升序的聚类顺序结束，并尝试降序。我使用的是 Cassandra 2.1.10、Spark 1.5.1 和 Da

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

scala - 使用 Datastax 的 Spark Cassandra Connector 在 TableDef 上设置 Cassandra 聚类顺序