scala - 将 Scala Range 拆分为大小均匀的连续子 Range-6ren

scala - 将 Scala Range 拆分为大小均匀的连续子 Range

转载作者：行者123 更新时间：2023-12-04 06:07:59

28

4

如果我有一个范围，如何将其拆分为一系列连续的子范围，其中指定了子范围(存储桶)的数量？如果没有足够的元素，则应省略空桶。

例如:

splitRange(1 to 6, 3) == Seq(Range(1,2), Range(3,4), Range(5,6))
splitRange(1 to 2, 3) == Seq(Range(1), Range(2))

一些额外的限制，排除了我见过的一些解决方案:

大致均匀的存储桶大小 - 存储桶大小最多应相差 1
输入范围的长度有时可能非常大，因此不应将范围具体化为序列(例如不能使用分组)
这也意味着我们不会以循环方式将数字分配给存储桶，因为这样每个存储桶中的数字将不连续，因此不会形成范围
理想情况下，子范围将按顺序生成，即 (1,2)(3,4)，而不是 (3,4)(1,2)

一位同事找到了解决方案here :

def splitRange(r: Range, chunks: Int): Seq[Range] = {
  if (r.step != 1) 
      throw new IllegalArgumentException("Range must have step size equal to 1")

  val nchunks = scala.math.max(chunks, 1)
  val chunkSize = scala.math.max(r.length / nchunks, 1)
  val starts = r.by(chunkSize).take(nchunks)
  val ends = starts.map(_ - 1).drop(1) :+ r.end
  starts.zip(ends).map(x => x._1 to x._2)
}

但是当 N 很小时，这会产生非常不均匀的桶大小，例如:

splitRange(1 to 14, 5)                          
//> Vector(Range(1, 2), Range(3, 4), Range(5, 6),
//|        Range(7, 8), Range(9, 10, 11, 12, 13, 14))
                              ^^^^^^^^^^^^^^^^^^^^^

最佳答案

浮点方法

一种方法是为每个存储桶生成小数(浮点)偏移量，然后通过压缩将它们转换为整数范围。空范围也需要使用collect过滤掉。

def splitRange(r: Range, chunks: Int): Seq[Range] = {
  require(r.step == 1, "Range must have step size equal to 1")
  require(chunks >= 1, "Must ask for at least 1 chunk")

  val m = r.length.toDouble
  val chunkSize = m / chunks
  val bins = (0 to chunks).map { x => math.round((x.toDouble * m) / chunks).toInt }
  val pairs = bins zip (bins.tail)
  pairs.collect { case (a, b) if b > a => a to b }
}

(此解决方案的第一个版本存在舍入问题，因此无法处理 Int.MaxValue - 现在已根据下面的 Rex Kerr 的递归浮点解决方案修复了该问题)

另一种浮点方法是向下递归范围，每次都将头部移出范围，这样我们就不会错过任何元素。此版本可以正确处理Int.MaxValue。

def splitRange(r: Range, chunks: Int): Seq[Range] = {
  require(r.step == 1, "Range must have step size equal to 1")
  require(chunks >= 1, "Must ask for at least 1 chunk")

  val chunkSize = r.length.toDouble / chunks

  def go(i: Int, r: Range, delta: Double, acc: List[Range]): List[Range] = {  
    if (i == chunks) r :: acc 
      // ensures the last chunk has all remaining values, even if error accumulates
    else {
      val s = delta + chunkSize
      val (chunk, rest) = r.splitAt(s.toInt)
      go(i + 1, rest, s - s.toInt, if (chunk.length > 0) chunk :: acc else acc)
    }
  }

  go(1, r, 0.0D, Nil).reverse
}

还可以递归生成(开始，结束)对，而不是压缩它们。本内容改编自 Rex Kerr 的 answer to a similar question

def splitRange(r: Range, chunks: Int): Seq[Range] = {
  require(r.step == 1, "Range must have step size equal to 1")
  require(chunks >= 1, "Must ask for at least 1 chunk")

  val m = r.length
  val bins = (0 to chunks).map { x => math.round((x.toDouble * m) / chunks).toInt }
  def snip(r: Range, ns: Seq[Int], got: Vector[Range]): Vector[Range] = {
    if (ns.length < 2) got
    else {
      val (i, j) = (ns.head, ns.tail.head)
      snip(r.drop(j - i), ns.tail, got :+ r.take(j - i))
    }
  }
 snip(r, bins, Vector.empty).filter(_.length > 0)
}

整数方法

最后，我意识到这可以通过调整 Bresenham's line-drawing algorithm 来使用纯整数算术来完成。，它解决了一个基本等效的问题 - 如何仅使用整数运算在 y 行上均匀分配 x 像素!

我最初使用 var 和 ArrayBuffer 将伪代码转换为命令式解决方案，然后将其转换为尾递归解决方案:

def splitRange(r: Range, chunks: Int): List[Range] = {
  require(r.step == 1, "Range must have step size equal to 1")
  require(chunks >= 1, "Must ask for at least 1 chunk")

  val dy = r.length
  val dx = chunks

  @tailrec
  def go(y0:Int, y:Int, d:Int, ch:Int, acc: List[Range]):List[Range] = {
    if (ch == 0) acc
    else {
      if (d > 0) go(y0, y-1, d-dx, ch, acc)
      else go(y-1, y, d+dy, ch-1, if (y > y0) acc 
                                  else (y to y0) :: acc)
    }
  }

  go(r.end, r.end, dy - dx, chunks, Nil)
}

请参阅维基百科链接以获取完整说明，但本质上该算法沿直线斜率呈之字形上升，或者添加 y 范围 dy 并减去 x 范围 dx。如果它们不能精确划分，则错误会累积，直到精确划分为止，从而导致某些子范围中出现额外的像素。

splitRange(3 to 15, 5)                         
//> List(Range(3, 4), Range(5, 6, 7), Range(8, 9), 
//|      Range(10, 11, 12), Range(13, 14, 15))

关于scala - 将 Scala Range 拆分为大小均匀的连续子 Range，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41707676/

28

4

0

文章推荐： mpi - 将 MPI 等级数推广到 MPI 组？

文章推荐： google-maps - 带有自定义图标的 Google Maps API v3 兴趣点

文章推荐： spring - 如何在Spring 3.0中定义EnumMap

java - Arraylist 分为 -
我有一个数组列表: ArrayList allText = new ArrayList(); 其内容是这样的: [Alabama - Montgomery, Alaska - Juneau, Ariz
php - 开始和结束时间，分为 1 小时段
我有一个 timestamp 格式的开始和结束时间。我想将它们分成多个时间段，例如 1 小时。 $t1 = strtotime('2010-05-06 12:00:00'); $t2 = strtot
css - span10 分为 3 列
我需要将 span10 分成 3 列，但我无法将它们排列起来。我应该在 span10 中添加一个 span12 还是使用 offset 还是？？
Pandas - 分为 24 小时区 block ，但不是午夜到午夜
我有一个时间序列。我想从早上 8 点到第二天早上 7:59 分成 24 小时的区 block 。我知道如何按日期分组，但我尝试过使用 TimeGroupers 和 DateOffsets 处理这个 8
java - Android Java 分为 4 个整数
我收到“街道号码邮政编码城市”形式的地址(作为字符串)。我想要做的是将街道和号码与邮政编码和城市分开。通常你可以按空格分割。但有些街道名称中也有空格，例如:“Emile Van Ermengemlaa
java - 将 JList 分为 2 组的优化方法
我有一个用户列表。其中一些用户处于第一状态，而其他用户处于第二状态。所以我想要的是将这个列表显示为首先，它按排序顺序显示存在 = 1 的用户，然后按排序顺序显示存在 = 2 的用户。这里的排序是根据用
javascript - 将 div 分为 3 列
我感觉我搜索了整个网络，但找不到一种方法将不同高度的 div 很好地划分为 3 列，就像 http://www.ing.nl 上那样 headertekst headerteksttesth
css - td 内的 Bootstrap 按钮下拉菜单，分为 2 行
Bootstrap 3 按钮下拉菜单出现问题。你可以在这里看到我的两个例子: http://www.bootply.com/W1dLusilMk http://www.bootply.com/GGBv
javascript - 返回的 php JSON 分为 2 个 Javascript 对象
我在 php 中执行以下操作 foreach($QuestionAsekd as $k => $v){ $grp_name = $v['NAME']; $groupValues[$gr
python - Pandas DataFrame [cell=(label,value)]，分为 2 个独立的数据框
我找到了一种用pandas解析html的绝妙方法。我的数据格式有点奇怪(见下文)。我想将这些数据拆分为 2 个单独的数据帧。注意每个单元格如何由，分隔...是否有任何真正有效的方法来分割所有这些单元
html - CSS
分为 2 列。没有

首页

博学

6Ren·AI

商城

scala - 将 Scala Range 拆分为大小均匀的连续子 Range