- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想将一个任意大小的随机值数组分组到 n
组中,这样任何一组/bin 中的值的总和尽可能相等。
因此对于值 [1, 2, 4, 5]
和 n = 2
,输出桶应该是 [sum(5+1),总和(4 + 2)]
。
我想到的一些可能性:
n
似乎最佳解决方案(在给定输入数组的情况下,箱子内容的总和尽可能相等)可能并不平凡;所以目前我倾向于最后一个选项,但感觉我可能缺少更优雅的解决方案?
最佳答案
这是一个 NP-hard 问题。换句话说,如果不探索所有组合就不可能找到最佳解决方案,并且组合的数量是 n^M(其中 M 是数组的大小,n 是 bean 的数量)。这是一个与 clustering 非常相似的问题,这也是 NP 难的。
如果您的数据集小到足以处理,则最好使用强力算法(探索所有组合)。
但是,如果您的数据集很大,您将需要一个多项式时间算法,它不会为您提供最佳解决方案,而是一个很好的近似值。在这种情况下,我建议您使用类似于 K-Means 的东西...
第 1 步。计算每个 bin 的预期总和。设 A 为您的数组,则每个 bin 的预期总和为 SumBin = SUM(A)/n(数组中所有元素的总和超过 bin 的数量) .
第 2 步。将数组的所有元素放入我们称为 The Bag 的某个集合(例如另一个数组)中(这只是一个概念,因此您可以理解接下来的步骤)。
第 3 步。将 The Bag 分成 n 组(最好是随机分组,以便每个元素以概率 1 结束在某个 bin i 中/n)。此时,您的箱子里有所有的元素,The Bag 是空的。
第 4 步。计算每个 bin 的总和。如果结果与上次迭代相同,则退出。 (这是 K-Means 的期望步骤)
步骤 5. 对于每个 bin i,如果其总和大于 SumBin,则选择第一个大于 SumBin 的元素并将其放入回到The Bag;如果其总和小于 SumBin,则选择第一个小于 SumBin 的元素并放回The Bag。这是 K-Means 的梯度下降步骤(又名最大化步骤)。
第 6 步。转到第 3 步。
这个算法只是一个近似值,但它很快并且保证收敛。
如果您对上述随机算法持怀疑态度,在第一次迭代后返回第 3 步时,您可以通过运行 Hungarian algorithm 来优化分配元素,而不是随机分配元素。 ,但我不确定这会保证更好的整体结果。
关于python - 将任意数据数组分组到 N 个 bin 中,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9541967/
我看到以下宏 here . static const char LogTable256[256] = { #define LT(n) n, n, n, n, n, n, n, n, n, n, n,
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
所以我得到了这个算法我需要计算它的时间复杂度 这样的 for i=1 to n do k=i while (k<=n) do FLIP(A[k]) k
n 的 n 次方(即 n^n)是多项式吗? T(n) = 2T(n/2) + n^n 可以用master方法求解吗? 最佳答案 它不仅不是多项式,而且比阶乘还差。 O(n^n) 支配 O(n!)。同样
我正在研究一种算法,它可以在带有变音符号的字符(tilde、circumflex、caret、umlaut、caron)及其“简单”字符之间进行映射。 例如: ń ǹ ň ñ ṅ ņ ṇ
嗯..我从昨天开始学习APL。我正在观看 YouTube 视频,从基础开始学习各种符号,我正在使用 NARS2000。 我想要的是打印斐波那契数列。我知道有好几种代码,但是因为我没有研究过高深的东西,
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭12 年前。 Improve th
谁能帮我从 N * N * N → N 中找到一个双射数学函数,它接受三个参数 x、y 和 z 并返回数字 n? 我想知道函数 f 及其反函数 f',如果我有 n,我将能够通过应用 f'(n) 来
场景: 用户可以在字符串格式的方程式中输入任意数量的括号对。但是,我需要检查以确保所有括号 ( 或 ) 都有一个相邻的乘数符号 *。因此 3( 应该是 3*( 和 )3 应该是 )*3。 我需要将所有
在 Java 中,表达式: n+++n 似乎评估为等同于: n++ + n 尽管 +n 是一个有效的一元运算符,其优先级高于 n + n 中的算术 + 运算符。因此编译器似乎假设运算符不能是一元运算符
当我阅读 this 问题我记得有人曾经告诉我(很多年前),从汇编程序的角度来看,这两个操作非常不同: n = 0; n = n - n; 这是真的吗?如果是,为什么会这样? 编辑: 正如一些回复所指出
我正在尝试在reveal.js 中加载外部markdown 文件,该文件已编写为遵守数据分隔符语法: You can write your content as a separate file and
我试图弄清楚如何使用 Javascript 生成一个随机 11 个字符串,该字符串需要特定的字母/数字序列,以及位置。 ----------------------------------------
我最近偶然发现了一个资源,其中 2T(n/2) + n/log n 类型 的递归被 MM 宣布为无法解决。 直到今天,当另一种资源被证明是矛盾的(在某种意义上)时,我才接受它作为引理。 根据资源(下面
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
我完成的一个代码遵循这个模式: for (i = 0; i < N; i++){ // O(N) //do some processing... } sort(array, array + N
有没有办法证明 f(n) + g(n) = theta(n^2) 还是不可能?假设 f(n) = theta(n^2) & g(n) = O(n^2) 我尝试了以下方法:f(n) = O(n^2) &
所以我目前正在尝试计算我拥有的一些数据的 Pearson R 和 p 值。这是通过以下代码完成的: import numpy as np from scipy.stats import pearson
ltree 列的默认排序为文本。示例:我的表 id、parentid 和 wbs 中有 3 列。 ltree 列 - wbs 将 1.1.12, 1.1.1, 1.1.2 存储在不同的行中。按 wbs
我的目标是编写一个程序来计算在 python 中表示数字所需的位数,如果我选择 number = -1 或任何负数,程序不会终止,这是我的代码: number = -1 cnt = 0 while(n
我是一名优秀的程序员,十分优秀!