arrays - 就地交错字符和数字数组的算法-6ren

arrays - 就地交错字符和数字数组的算法

转载作者：行者123 更新时间：2023-12-02 19:05:40

有一个像[a,b,2,c,3,d,4,1]这样的数组。必须就地将其修改为类似[a,2,b,3,c,4,d,1]的数组。

也就是说，从散布有字母和数字的原始数组开始，修改后的版本应包含相同的元素，以使该数组具有交替的字母和数字，同时保留其原始相对顺序。

通过使用两个指针并将修改后的版本输出到新数组中，可以轻松完成此操作，但是必须在O(N)时间和O(1)空间中就地完成。可能吗？如果可以，怎么办？

最佳答案

O（N）就地算法是可能的。您可以将所有字母排序到数组的开头，将所有数字排序到末尾。然后就地转置2x（N / 2）矩阵，以将所有元素从数组的前半部分放置到偶数位置，将其他元素放置到奇数位置。 This question解释了如何进行此转置（实际上，此处描述的算法应反向应用）。

最棘手的部分是排序。它应该既稳定又就位。

按O（N2）时间排序很简单。插入排序或冒泡排序即可。

O（N log N）时间更加复杂。使用稳定的就地合并排序，如this answer中所述。这个答案给出了一对链接，描述了思想，这些链接可以用来构成O（N）算法，它比稳定的就地合并排序要简单，但是仍然很复杂，因此我只给出一个草图。

将阵列分为两个区域。其中一个将用于临时存储算法其他部分所需的一些数据（由于该区域仍应存储数组元素，因此任何其他信息均按这些元素的顺序进行编码）。其他区域被解释为一个正方形矩阵，在这里应该对元素进行排序，首先是行，然后是列。对两个区域进行排序后，对每个区域应用转置算法，以将字符和数字放置在适当的位置。

1.从阵列的一部分中进行临时存储

数组的大多数元素被组织为大小为K的方阵。K是最大的偶数，因此2 * 8 * K + K2不大于N。临时存储的大小M = N-K2，大约为等于2 * 8 * sqrt（N）。

要准备M个元素以进行临时存储，请扫描阵列的前M个元素，然后确定在此范围内最少代表哪种元素。例如，将其设置为“数字”。将数字打包成一组大小为M / 2的数字。为此，迭代交换字母和数字块，如以下示例所示：

ddaaaddddadddaaaaad
aaaDDddddadddaaaaad
aaaaDDDDDDdddaaaaad
aaaaaaaaaDDDDDDDDDd

当单个组中至少收集了M / 2位数字时停止。块交换过程（也可以称为就地子阵列旋转）可以作为 this answer的第一个算法或如下实现：

倒数位
反向数字块
一起反转两个块

例：

123abcd
321abcd
321dcba
abcd123

将数字打包到大小为M / 2的组中需要最多移动（M / 2）2个数字和最多N / 2个字母，因此可以在O（N）时间内完成。

确切地说，现在是O（N log2 U）时间，可以对ASCII字符进行排序，但是如果我们需要对其他类型的值进行排序，则该时间太大（U是值集的大小）。为了将运行时间缩短到O（N * log U * log log U），请从较小的临时存储区大小2 * K开始，使用它对log U范围进行排序，然后将这些范围与块交换过程成对合并，以成对记录记录U步骤以获取适当大小的临时存储。

在这一点上，我们有M / 2大小的数字块，其后是一个字母块（可能是较大的字母）。使用块交换过程来制作两个大小相等的M / 2块。

为了将数据位存储在临时存储中，我们可以在位置i和i + M / 2处交换元素。如果位置i存储一个字母，而位置i + M / 2存储一个数字，则我们有零位。如果数字排在第一位，则我们有非零位。 8个连续位编码单个字符。这意味着，我们最多可以记住临时存储区中的K个字符。

将位存储在临时存储中的其他替代方法是将其“数量”一半。每个数字可以存储为“ 0” ..“ 9”（表示位0），也可以存储为“ a” ..“ j”（表示位1）。如果可能的字母数至少是数字数的3倍，则我们可以在每个值中存储2位。为了从每个值中压缩4位，我们可以将每2位压缩为一个字节。这给出了M / 4个空闲字节；因此M可以减小为4 *K。

2.对矩阵的行进行排序

从这一点出发，我们应该使用临时存储作为附加内存来重新排列阵列的主要区域。确定在大小为2 * K的子数组中最少表示哪种元素。例如，让它为“数字”。顺序扫描阵列，将数字移动到临时存储区，然后将字母打包成连续的序列。当收集到K个数字时，我们将按顺序排列L个字母，并且L> =K。将最后L％K个字母移到空闲区域的末尾，并用临时存储区中的数字填充剩余的空闲区域。然后继续顺序扫描阵列。

此过程仅复制阵列的每个元素一次或两次，因此需要O（N）时间来完成。最后，将所有字母/数字块对齐，以使矩阵的每一行都包含一种元素。

3.对矩阵的列进行排序

这是先前过程的简化版本。对于每个矩阵列，将数字移动到临时存储并将字母打包到连续的行中，然后将数字从临时存储复制到空闲的行。

此过程还需要O（N）时间才能完成。在最后，数组的主要区域已完全排序。现在对临时存储进行排序（将零写入每个“位”）。

4.转置数组

剩下的唯一步骤是转置阵列的临时存储区和主区域，以使字符和数字位于适当的位置。（请注意，不是其中的一个链接答案中提到的算法，就是将由两个子阵列组成的两个K x K矩阵而不是K x K矩阵进行转置）。

此过程以及整个算法需要O（N）时间。

第二种算法。

由于ASCII仅包含10位数字和52个字母，因此我们可以通过以下方式大大简化算法：

使用BASE64编码压缩值的最后1/3，这将提供N / 12字节的可用空间（用作临时存储）。
使用此空间作为临时存储对值的前1/3进行排序：确定大小为N / 6的子数组中最少表示的元素类型；例如，使其为“数字”；顺序扫描阵列，将数字移动到临时存储区，并将字母包装成连续序列；然后将临时存储复制到空闲空间；对接下来的N / 6个元素重复此操作。
解压缩值的最后1/3，解压缩值的前1/3。
排序最后2/3个值（将N / 6个元素排序4次）。
解压缩值的前1/3。
此时，我们有12组字符（大小可变）。使用块交换过程在这些组之间移动这些组，并以适当的顺序（字母，数字等）制作12个大小相等的组。
转置6对字符组。实际上，这里可以使用简单的换位算法。对所有未标记元素（位7为零）应用循环前导算法，并在移动元素时将其位7设置为1。完成后，清除所有标记。

第三算法。

解决此问题的另一种方法是，将所有字母排序到数组的开头，将所有数字排序到末尾，并用 this pdf中描述的就地稳定基数排序（对它进行一些修改）。排序后，应用前面提到的转置算法。

这里最棘手的事情是此基数排序算法的压缩部分。我们无法从每个值中节省一位。相反，我们应该使用算术编码。

关于arrays - 就地交错字符和数字数组的算法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12762984/

文章推荐： Logstash 期望其中之一#

文章推荐： slack-api - 松弛 : Retrieve all messages

文章推荐： assembly - 可以跳过每个第二个字节的SSE mov指令？

文章推荐： registry - 更改 Windows Azure 上的 http.sys 注册表设置？

excel - 范围内的 VBA 字数
嗨，我是excel的初学者，所以请原谅我的无知。最近我发现自己需要一个函数来计算一系列单元格中的单词数(当然，将空单元格计为 0)。在网上冲浪我发现了这个简单的 VBA 代码: Function
c - 字数、行数和字符数不适用于 c
我是编程新手，这段代码不想工作，而且我已经没有想法了。它可以很好地读取文件，但不会计算任何内容。我知道它与 while 语句有关。这是针对两个单独的文件，但它们都需要显示在末尾。 #define _C
Java 字数 : a mediocre implementation
我用 Java 实现了一个字数统计程序。基本上，该程序需要一个大文件(在我的测试中，我使用了一个仅包含数字的 10 GB 数据文件)，并计算每个“单词”出现的次数 - 在这种情况下，一个数字(例如 2
algorithm - 字数 : how inefficient is McIlroy's solution?
长话短说:1986 年，一位面试官要求 Donald Knuth 编写一个程序，输入文本和数字 N，并列出按频率排序的 N 个最常用的词。 Knuth 编写了一个 10 页的 Pascal 程序，Do
mysql - SQL 查询中的 SUM 字数
我有一个包含 2 个字段的表: cnt str -- ------- 60 the 58 of 4 no 30 the 2 of 1 no 我想要这样的结果 cnt
加速百度收录内页文章需要注重“主题+排版+字数+新颖”
各位seoer应该都明白，要想网站有排名，收录是前提条件，没有收录完全谈不上排名、流量。但是内页的收录往往是seo最大的难题之一，笔者手上有一堆网站都是只被收录了首页或者几页内页，因此解决内页收录问
java - 使用 Checkstyle 检查评论/Javadoc 字数
是否可以设置一个 checkstyle 规则来计算评论中的字数，然后在字数低于定义的限制时显示问题。我在checkstyle上搜索了Javadoc属性，但没有发现有用的东西。例如: /** * S
c - 从重定向的 stdin 读取(字数)- C
我有一个名为“input.txt”的文本文件，其中包含: test line one test line two final line 编译并运行后通过 $ ./a.exe #include
python - 如何从 pandas 系列元素中获取 "aggregate"字数
我目前在带有 pandas 0.23.4 的 Jupyter Notebook (v5.6.0) 中使用 python3.7。我编写了代码来标记一些日语单词，并成功应用了一个字数统计函数，该函数返回
javascript - 如何显示 Redactor 富文本/html 编辑器的字符数/字数？
我刚刚用出色的 Redactor 替换了 CKEditor(它伴随着大量与 AJAX 更新 DOM 相关的神秘问题) .我们以前使用 CKEditor 插件为我们提供富文本编辑器的字符数。我怎样才能用
java - 映射 100% 减少 0% 运行 hadoop 字数
我想在 Eclipse 集群上运行 hadoop 字数统计。但我收到错误。我更改了输出目录，但程序行为没有变化。你能帮我解决这个错误吗: 2013-10-23 23:06:13,783 WA
Hadoop 字数 MapReduce : Getting invalid argument error for setInputFormatClass
我正在尝试运行一个 wordcount 程序，但我收到以下代码的错误 job.setInputFormatClass(TextInputFormat.class); job.setOutputForm
java - Hadoop 字数 : receive the total number of words that start with the letter "c"
这是 Hadoop 字数统计 java map 和 reduce 源代码: 在 map 函数中，我已经可以输出所有以字母“c”开头的单词以及该单词出现的总次数，但我想做的只是输出以字母“c”开头的单词

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

arrays - 就地交错字符和数字数组的算法