- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在处理高频的时间戳事件流,没有排序保证(90% 的时间都是排序的)。我需要在程序中存储这些事件(用于缓存目的)一段时间。为了优化我的计算的性能(主要需要对事件集合进行迭代),如果我可以通过缓存有序列表来保证顺序,那么对我来说会更容易。所以我正在寻找的是一种插入和迭代速度快并且允许重复的有序数据结构。
在我在互联网上找到的所有建议中,我尝试过:
- TreeSet -> 不起作用,因为我可能有重复的时间戳
- PriorityQueue -> 不起作用,因为迭代器不保证优先级顺序
由于 9/10 事件的顺序很好,我想我可以使用带有修改版本的 add 方法的基本 ArrayList :
public class TimeOrderedArrayList<E> extends ArrayList<E>{
private long lastTs;
private Comparator<E> comparator;
private TimeGetter<E> tsgetter;
public TimeOrderedArrayList (Comparator<E> comparator, TimeGetter<E> tsgetter) {
super();
this.comparator = comparator;
this.tsgetter = tsgetter;
this.lastTs = Long.MIN_VALUE;
}
@Override
public boolean add(E e) {
if (tsgetter.getTime(e) >= lastTs) {
lastTs = tsgetter.getTime(e);
return super.add(e);
} else {
// VERSION 1
int index = super.size()-1;
while (tsgetter.getTime(super.get(index))>tsgetter.getTime(e) && index > 0) {
index--;
}
super.add(index, e);
// VERSION 2
int index = Collections.binarySearch(this, e, comparator);
super.add(index>-1 ? index : -index-1,e);
return true;
}
}
@Override
public boolean addAll(Collection<? extends E> c) {
boolean result = super.addAll(c);
super.sort(comparator);
return result;
}
}
但是对于这两个版本,我的表现都非常糟糕。
有什么建议吗?
最佳答案
从问题描述来看,在我看来,只要您可以在一段时间内对事件集合进行迭代,问题就不需要严格的顺序。此外,您提到的数据类型似乎是多个客户端节点将数据发送到一台集中式服务器的数据(可能是来自多个服务的日志/事件累积)。
如果是这种情况,您可以探索使用简单的存储桶数组,其中与时间戳对应的事件仅进入特定的存储桶。您将确保所有具有非常接近时间戳的事件都被分类到相同的存储桶中,以便您可以实现事件之间的偏序。
例如:如果您需要最后 1 分钟(60 秒)的数据,您可以定义 60 个存储桶,每秒一个,并不断轮换它们。时间戳为 2016-12-08 19:59:29.538331
的事件将进入第 29 个存储桶(假设索引从 0 开始,并且您采用每个事件的秒数作为下限)。当一分钟过去后,只需清除第 i 个存储桶的过去数据,然后重新开始构建它即可。因此,在 2016-12-08 20:00:00.129845
,第 0 个存储桶被重置为空数组。
由于您有高频的时间戳事件流,因此空桶等的可能性将很小。您可以根据您的具体要求调整所需的存储桶数量。
关于Java时间有序数据结构,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41040759/
就类似于这个问题:mongodb query multiple pairs using $in 我想用 (first, last) >= ('John', 'Smith') 找到前 10 个全名。使用
如何保留向 NSDictionary 添加对象的方式? 我意识到 NSDictionary 中的值没有特定的顺序,但就我而言,我需要保留使用 setValue:forKey: 添加的顺序,例如一个数组
看看上证所运营商 CMPORDPS - ordered compare packed singles CMPUNORDPS - unordered compare packed singles 有序和
我使用 PowerMock 来模拟静态方法。我需要验证静态和非静态方法调用的顺序。可以使用 PowerMock 来做吗? UPD 我使用 powermockito 扩展来模拟静态方法,因此使用 pow
例如,如何合并两个已排序的整数流?我认为这是非常基本的,但只是发现它根本不是微不足道的。下面的不是尾递归的,当流很大时它会堆栈溢出。 def merge(as: Stream[Int], bs: St
我试图在二叉树中查找/打印每个节点的中序后继,但编译器给我的结果是段错误。 这是结构:- struct node { int x; struct node *left; str
我有一个查询看起来像 SELECT a, b, c, d FROM tab ORDER BY a ASC, b ASC 我的结果集看起来像 +-----------------
首先,我试过搜索这个主题但一无所获(似乎找不到合适的关键词),所以如果这是重复的,请告知。 我一直在尝试从我的数据库中获取一些 time_stamp 并将它们按时间间隔排序。例如,我运行一个查询,如
这个问题在这里已经有了答案: How do I get the index of an iterator of an std::vector? (9 个回答) 关闭 6 年前。 我已经订购了 QVe
我有以下实体,如果我尝试通过 removeTask 方法从 TaskList 中删除 Task,则会出现异常。 @Entity public class TaskList extends Generi
所以,我对 C 编程还是很陌生。 有3个长度相同的字符串。 str1="abc", str2="def", str3="ghi". 新字符串中的输出将类似于“adgbehcfi”。 #include
我的查询有一个问题,它花费的时间太长(仅仅这个简单的查询就超过了两秒)。 乍一看,这似乎是一个索引问题,所有连接的字段都已编入索引,但我找不到其他我可能需要编入索引以加快速度的内容。一旦我将我需要的字
我正在寻找一个 Map 实现,它按照键值对的添加顺序迭代它们。例如 Map orderedMap = // instantiation omitted for obvious reasons :) o
我正在寻找具有以下功能的数据库系统: 分层(多维)键 每个维度的键排序 因此,如果我的 key 类似于 App > User > Item,我可以运行如下查询:“该用户的下一项是什么?”或者“这个应用
以下类使用 CRTP 尝试将类型添加到具有 Schwarz 计数器以确保初始化顺序的 std::vector。根据 3.6.2/2 成员 h_ 具有无序初始化。我将如何更改它以确保它已订购初始化?我希
我正在实现一个玩具调度程序,它读取进程规范(例如到达时间、总运行时间)的输入文件,然后根据随机 io/cpu 突发调度进程。 文件格式 Arrival time, total CPU time, CP
我目前正在使用 python 2.7 requests 库,并且不支持有序 header 。我可以为 post 和 get 放置有序数据(如有序字典),但根本不支持标题。甚至在 python 3 中也
我正在使用来自 google guava 的 ConcurrentHashMap(通过 MapMaker),但该实现未排序。google guava 中有 ConcurrentSkipListMap,
我有一个旧应用程序,其中使用 ConcurrentHashMap。现在我们知道并发HasMap 是无序的,但是需要读取最初插入的对象。我已经在生产中使用了一段时间的代码,因此我正在寻找快速替代方案来替
最近我开始使用 .NET Core 2.1 开发一个新项目,我决定使用 SOLID 原则并创建一个漂亮的项目结构。 这是一个 Web API 项目。一切正常我使用了很多依赖注入(inject),大部分
我是一名优秀的程序员,十分优秀!