java - 具有 O(logN) 插入的排序数据结构，提供插入点索引-6ren

java - 具有 O(logN) 插入的排序数据结构，提供插入点索引

转载作者：行者123 更新时间：2023-12-04 22:48:38

25

4

我的目标是一个可以完成两件事的排序数据结构:

快速插入(根据排序顺序在位置)

我可以快速地将我的数据分割成大于或小于或等于一个元素的所有内容的集合。 我需要知道每个分区的大小 ，并且我需要能够“获取”这些分区。

目前，我正在使用 ArrayList 在 java 中实现它。这很容易提供＃2，因为我可以执行二进制搜索( Collections.binarySearch )并获得一个插入索引，告诉我将在什么时候插入一个元素。然后基于索引范围从 0 到数组大小的事实，我立即知道有多少元素大于我的元素或小于我的元素，并且我可以轻松获取这些元素(作为子列表)。但是，这没有属性 #1，并导致过多的数组复制。

这让我想使用像 SkipList 或 RedBlackTree 这样可以更快地执行插入的东西，但是我不知道如何在不花费 O(N) 时间的情况下满足属性#2。

任何建议，将不胜感激。谢谢

编辑:感谢以下引用数据结构的答案，这些数据结构在 O(logN) 时间内执行插入并且也可以快速分区，但我想强调 size() 要求 - 我需要知道这些分区的大小必须遍历整个分区(其中， according to this 是 TreeSet 所做的。这背后的原因是，在我的用例中，我使用多个不同的数据结构副本维护我的数据，每个副本使用不同的比较器，然后需要询问“根据什么比较器是大于特定元素最小的所有事物的集合”。在 ArrayList 的情况下，这实际上很容易，并且只需要 O(YlogN) 其中 Y 是比较器的数量，因为我只是二进制搜索每个 Y 数组并返回具有最高插入索引的数组列表。我不清楚如何在不采用 O(YN) 的情况下使用 TreeSet 来实现这一点。

我还应该补充一点，即使无法准确解决插入索引的近似答案，它仍然很有值(value)。

最佳答案

使用通用 Java TreeSet .插入需要 O(logN)，因此您的第 1 个要求已完成。这是文档中的引用:

This implementation provides guaranteed log(n) time cost for the basic operations (add, remove and contains).

并且因为它实现了 NavigableSet interface ，您有 #2 或您的要求，使用以下方法:

tailSet(someElem) 返回 Set从 someElem 开始查看直到最后一个元素

headSet(someElem) 返回 Set从第一个元素开始查看直到 someElem

subSet(fromElem, toElem) 返回 Set从 fromElem 开始查看直到 toElem

这些操作被包含/排除提供的边界的版本重载。
TreeSet非常灵活:它允许您定义 Comparator订购 Set以自定义方式，或者您也可以依赖元素的自然顺序。

编辑:

根据返回子集的要求 size()操作至不是是 O(n) ，恐怕Java API中没有临时实现。

是的， TreeSet 返回的 Collection View 范围操作，实现 size()通过“跳转”到 O(log n) 中 View 的第一个元素时间，然后迭代后续元素，每次迭代加1，直到到达子集的末尾。

我必须说这很不幸，因为并不总是需要遍历返回的子集 View ，但有时，提前知道子集的大小可能非常有用(因为它是您的用例)。

因此，为了满足您的要求，您需要另一个结构，或者至少需要一个辅助结构。经过一番研究，我建议您使用 Fenwick tree . Fenwick 树也称为二进制索引树 (BIT)，可以是不可变的或可变的。不可变版本是用数组实现的，而可变版本可以用平衡二叉树实现，即红黑树(Java TreeSet 实际上是作为红黑树实现的)。 Fenwick 树主要用于存储频率并计算直到 O(log n) 中给定元素的所有频率的总和。时间。

请引用 this question here on Stack Overflow对于这个完全未知但非常有用的结构的完整介绍。 (由于堆栈溢出中的解释，我不会在这里复制它)。

Here's another Stack Overflow question询问如何正确初始化 Fenwick 树和 here's actual Java code showing how to implement Fenwick tree's operations .最后， here's a very good theoretic explanation关于所使用的结构和底层算法。

Web 中所有示例的问题在于它们使用结构的不可变版本，这不适合您，因为您需要在向结构中添加元素的过程中交错查询。但是，它们对于完全理解所使用的结构和算法都非常有用。

我的建议是你学习 Java TreeMap的实现，看看如何修改/扩展它，以便您可以将其变成保留 1 的 Fenwick 树作为每个键的值。这个 1将是每个键的频率。所以Fenwick树的基本操作 getSum(someElement)实际上会返回从第一个元素到 someElement 的子集的大小, 在 O(log n)时间。

因此，挑战在于实现一个平衡树(实际上是 Java 的 Red-Black TreeMap 的后代)，它实现了您需要的所有 Fenwick 树的操作。我相信你会完成 getSum(somElement) ，但也许您也可以扩展返回的子树范围 View ，以便它们都引用 getSum(someElelment)实现时 size()范围 View 的操作。

希望这会有所帮助，至少我希望这是一个很好的起点。请让我知道您是否需要澄清以及示例。

关于java - 具有 O(logN) 插入的排序数据结构，提供插入点索引，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28822366/

25

4

0

文章推荐： .net - 如何在 PowerShell 中删除所有导入的模块？

文章推荐： build - 团队城市 :User must pass parmeters to build

文章推荐： graph - D3 力布局可以可视化多图吗？

文章推荐： redirect - Ubuntu : Port forwarding to a guest VM 上的 KVM

sql - 哪个最快，1x 插入 512 行，4x 插入 128 行，或 512x 插入 1 行
我有 512 行要插入到数据库中。我想知道提交多个插入内容是否比提交一个大插入内容有任何优势。例如 1x 512 行插入 -- INSERT INTO mydb.mytable (id, phonen
sql:删除 + 插入 vs 更新 + 插入
已经提出了类似的问题，但由于它总是取决于，我单独询问我的具体情况。我有一个网站页面，显示来自数据库的一些数据，要从该数据库生成数据，我必须执行一些相当复杂的多连接查询。数据每天(每晚)更新一次。
python - pymongo 插入 vs pymysql 插入
我正在使用 MongoDb 和 MySQL 的 python 连接器 pymongo 和 pymysql 测试 MongoDb 和 MySQL，特别是插入功能。 pymongo版本是3.4，pymys
sql - 大型 SQL 插入 TVF 与 BULK 插入
从 C# 应用程序插入大型数组(10M 元素)的最快方法是什么？到目前为止，我使用的是批量插入。 C# 应用程序生成一个大文本文件，我使用 BULK INSERT 命令加载它。出于好奇，我编写了一个
java - 语法错误 : insert "enum Identifier", 插入 "EnumBody"，插入 "}"
我编写了一个枚举类型，当我为它运行我创建的 JUnit 测试时会出现以下语法错误: java.lang.Error: Unresolved compilation problems: Synt
C二叉搜索树实现——插入
我正在尝试创建一个程序，它将单词列表作为输入，并将它们排序为二叉树，以便能够找到它们，例如像字典。这是我到目前为止所做的，但是 newEl -> el = input; 出现段错误，我知道这是因为它试
latex - 缺少 $ 插入
你好我有编译这个问题 \begin{equation} J = \sum_{j=1}^{C} \end{equation} 我不断收到错误 missing $ inserted 这很奇怪，因
没有主键的 Linq 插入
我需要使用 LINQ to SQL 将记录插入到没有主键的表中。 table 设计得很差；我无法控制表结构。该表由几个 varchar 字段、一个文本字段和一个时间戳组成。它用作其他实体的审计跟踪。
插入 PdfCell 时图像会调整大小
我正在尝试使用 itextsharp 创建 Pdf。我添加了一张包含两列的表格，其中一列包含文本和其他图像。我想要恒定的图像大小如果另一个单元格中的文本增加并且其他单元格中的图像大小不同，我的图像会
php - 插入…………从中选择
我想把 calory 作为 fruits 的第一个值，我做不到，有人能帮忙吗？ $sql = 'INSERT INTO fruits VALUES('', ?, ?, ?)'
r - 插入/扩展季度到月度系列
我有一个包含季度观察结果的 data.frame。我现在想插入每月值(首选三次，线性很好)。中间目标应该是使用 DATE 创建一个 data.frame作为所有每月观察的索引和缺失值。谷歌搜索表明我
sql - 用数组“插入”
我想知道是否有办法在值列表中使用“插入”。我正在尝试这样做: insert into tblMyTable (Col1, Col2, Col3) values('value1', value
Javascript 插入 IFRAME
我想让人们能够在他们的网站中插入单个 Javascript 行，这实际上允许我插入包含我网站内容的固定大小的 IFRAME。它实际上是一个小部件，允许他们搜索我的网站或接收其他信息。这可能吗？最佳答
c# - 插入、选择和更新日期时间
我有一个包含时间的表，列名为 time，数据类型为 Date。在 asp.net 中，我想要一个查询插入日期，另一个查询则在 2 个日期之间进行选择。我已经尝试过这个: string data =
triggers - 触发编译错误(插入)
这是我的代码: create or replace trigger th after insert on stock for each row declare sqty number;
使用存储过程的具有唯一约束的 SQL 插入
这是一个带有具体示例的通用问题。我有一个包含三个字段(流派 ID (PK IDENTITY)、流派和子流派)的表。该表对(流派，子流派)组合具有唯一约束。我想知道如何修改存储过程以在表中不存在时插
Java:插入/替换到特定大小的排序数组
因此，我正在遍历二叉树，节点包含字符串，以及读取文件时该字符串是否出现多次。我只查找读取文件时出现次数最多的前 10 个单词，因此本质上我只是比较 int 值。我的问题是我正在尝试找出一种有效的方法
c++ - 插入 map
我有一张机票和行李 map ，每张门票必须是唯一的，并且必须与 map 上的位置相对应是否可以仅更改行李(m_bagage->秒)而不更改 key ？ std::unordered_map m_c
Java Jdbc 插入
我正在使用 jdbc 驱动程序做一个示例项目。我的问题是，如果我在 2 文本字段中输入空值。 null 不应该加载到数据库中吗？有没有办法避免在数据库中插入空字段？任何帮助将不胜感激。 //Execu
SSIS:插入/更新
我想知道 SSIS 中是否有特定的插入或更新选项。如果我想让程序检查它是更新还是插入，我是否必须做一些编码？或者是否可以启用一个选项，以便它会自行检查 PK 是否存在，然后更新，否则插入？亲切的问

首页

博学

6Ren·AI

商城

java - 具有 O(logN) 插入的排序数据结构，提供插入点索引