- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
问题是:
条目按时间顺序写入文件,每行一个条目。每个条目的格式是:
[时间戳][空间][用户 ID][空间][页面类型 ID]\n
您的任务是从一组日志中确定所有用户最常见的 10 个三页序列。
例如,这是一个示例日志:
1248977297 BBBB Search
1248977302 AAAA Browse
1248977308 BBBB Search
1248977310 AAAA Browse
1248977317 BBBB Search
1248977325 AAAA Search
1248977332 AAAA Search
1248977332 BBBB Search
1248977339 BBBB Checkout
1248977348 AAAA Search
1248977352 BBBB Browse
1248977367 AAAA Search
The first three-page sequence made by user AAAA is “Browse->Browse->Search”
The second three-page-sequence made by user AAAA is “Browse->Search->Search”
The third three-page-sequence made by user AAAA is “Search->Search->Search”
The fourth three-page-sequence made by user AAAA is “Search->Search->Search”
给出示例数据的程序输出应该是:
Search -> Search -> Search = 4
Browse -> Browse -> Search = 1
Search -> Search -> Checkout = 1
Browse -> Search -> Search = 1
Search -> Checkout -> Browse = 1
输出必须包含前 10 个三页序列(按顺序)和每个序列的出现次数。
我想到的最好的算法是 O(n^2),但我找到的答案是它可以在 O(N+ N*lg(N)) 中完成,我如何才能归档这种复杂性?, 表示在 O(N) 中列出并在 O(N lg(N)) 中排序
/* Solution
* Runtime complexity: O(n^2).
* Spatial complexity: O(n).
*/
import java.io.*;
import java.util.*;
public class Solution {
public static void main(String args[]) throws IOException {
/*
* Reads the input from a txt file.
*/
String file = "C:\\Users\\Public\\Documents\\txt\\files";
BufferedReader f = new BufferedReader(new FileReader(file + ".txt"));
String line = "";
/*
* @map data structure to store all the users with their page ids.
*/
Map<Integer, List<String>> map = new HashMap<Integer, List<String>>();
/*
*Read the txt or log file and store in the @map the user<Integer> and in a list<String> all the page sequences that he visited.
*/
while ((line = f.readLine()) != null && line.trim().length() != 0) {
StringTokenizer tokens = new StringTokenizer(line);
while (tokens.hasMoreElements()) {
String timeStamp = tokens.nextToken();
int userId = Integer.parseInt(tokens.nextToken());
String pageType = tokens.nextToken();
List<String> values = map.get(userId);
if (values == null) {
values = new ArrayList<String>();
map.put(userId, values);
}
values.add(pageType);
}
}
/*
* Create the sequences by user.
*/
List<String> listSequences = generateSequencesByUser(map);
/*
* Count the frequency of each sequence.
*/
Map<String, Integer> mapFrequency = countFrequencySequences(listSequences);
/*
* Sort the map by values.
*/
Map<String, Integer> sortedMap = Solution.sortByValue(mapFrequency);
/*
* Print the Top 10 of sequences.
*/
printTop10(sortedMap);
}
/*
* Method to create sequences by user.
*/
public static List<String> generateSequencesByUser(Map<Integer, List<String>> map) {
List<String> list = new ArrayList<String>();
for (Map.Entry<Integer, List<String>> entry : map.entrySet()) {
int key = entry.getKey();
for (int i = 2; i < entry.getValue().size(); i++) {
String seq = entry.getValue().get(i - 2) + "->" + entry.getValue().get(i - 1) + "->" + entry.getValue().get(i);
list.add(seq);
}
}
return list;
}
/*
* Method the frequency of each sequence and stored in a map.
*/
public static Map<String, Integer> countFrequencySequences(List<String> listSequences) {
Map<String, Integer> mapFrequency = new HashMap<String, Integer>();
for (String temp : listSequences) {
Integer counter = mapFrequency.get(temp);
if (counter == null) {
counter = 1;
mapFrequency.put(temp, counter);
} else {
mapFrequency.put(temp, counter + 1);
}
}
return mapFrequency;
}
/*
* Method to print the top 10 of sequences.
*/
public static void printTop10(Map<String, Integer> map) {
int count = 0;
for (Map.Entry<String, Integer> entry : map.entrySet()) {
count++;
if (count > 10) {
break;
} else {
System.out.println(entry.getKey() + " = " + entry.getValue());
}
}
}
/*
* Order the map by values.
*/
public static Map<String, Integer> sortByValue(Map<String, Integer> map) {
List list = new LinkedList(map.entrySet());
Collections.sort(list, new Comparator() {
public int compare(Object o1, Object o2) {
return ((Comparable) ((Map.Entry) (o2)).getValue()).compareTo(((Map.Entry) (o1)).getValue());
}
});
Map result = new LinkedHashMap();
for (Iterator it = list.iterator(); it.hasNext();) {
Map.Entry entry = (Map.Entry) it.next();
result.put(entry.getKey(), entry.getValue());
}
return result;
}
}
最佳答案
通过将问题拆分为三个更简单的任务,您可以在 O(N LogN) 或更好的时间内完成任务:
第一个任务是标准排序。我们假设现在是 O(N LogN)*。
第二个任务很容易用一对 HashMap 完成:
上面的每一步都是每个日志条目的 O(1) 操作,所以这个任务的时间是 O(N)
第三个任务是按计数选择前十个条目,可以通过检索键-计数对并按计数对它们进行排序来完成。在最坏的情况下,当所有页面转换都是唯一的时,您最终会得到 3N 个要排序的条目,因此此任务又是一个 O(N LogN) *。
了解算法后,实现应该很简单,因为 Java 提供了实现算法的每个任务的所有构建 block 。
* 您可以通过两个观察将时间减少到 O(N):
不过,此实现需要做更多的工作,因为 Java 不为其提供现成的“构建 block ”。
关于java - 我如何在 java 页面序列练习中获得更好的时间复杂度 Big O,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27624983/
您好,我是使用 xampp 的 PHPmyadmin 新手,没有 MYSQL 背景。当我喜欢研究它是如何工作的时,我的脑海中浮现出一个想法,它让我一周都无法休眠,因为我似乎无法弄清楚如何使用 MIN(
Go docs say (强调): Programs using times should typically store and pass them as values, not pointers.
我有一组用户在 8 月 1 日有一个条目。我想找到在 8 月 1 日有条目但在 8 月 2 日没有做任何事情的用户。 现在是 10 月,所以事件已经过去很久了。 我有限的知识说: SELECT * F
我有以下代码,主要编码和取消编码时间结构。这是代码 package main import ( "fmt" "time" "encoding/json" ) type chec
您能详细解释一下“用户 CPU 时间”和“系统 CPU 时间”吗?我读了很多,但我不太理解。 最佳答案 区别在于时间花在用户空间还是内核空间。用户 CPU 时间是处理器运行程序代码(或库中的代码)所花
应用程序不计算东西,但做输入/输出、读取文件、使用网络。我希望探查器显示它。 我希望像 callgrind 中的东西一样,在每个问题中调用 clock_gettime。 或者像 oprofile 那样
目前我的 web 应用程序接收 websocket 数据来触发操作。 这会在页面重新加载时中断,因此我需要一个能够触发特定事件的客户端解决方案。 这个想法可行吗? 假设你有 TimeX = curre
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我有一个 Instant (org.joda.time.Instant) 的实例,我在一些 api 响应中得到它。我有另一个来自 (java.time.Instant) 的实例,这是我从其他调用中获得
如何集成功能 f(y) w.r.t 时间;即 'y'是一个包含 3000 个值和值 time(t) 的数组从 1 到 3000 不等。所以,在整合 f(y) 后我需要 3000 个值. 积分将是不确定
可以通过 CLI 创建命名空间,但是如何使用 Java SDK 来创建命名空间? 最佳答案 它以编程方式通过 gRPC API 完成由服务公开。 在 Java 中,生成的 gRPC 客户端可以通过 W
我有一个函数,它接受 2 组日期(开始日期和结束日期),这些日期将用于我的匹配引擎 我必须知道start_date1和end_date1是否在start_date2和end_date2内 快进:当我在
我想从 Python 脚本运行“time”unix 命令,以计算非 Python 应用程序的执行时间。我会使用 os.system 方法。有什么方法可以在Python中保存这个输出吗?我的目标是多次运
我正在寻找一种“漂亮的数字”算法来确定日期/时间值轴上的标签。我熟悉 Paul Heckbert's Nice Numbers algorithm . 我有一个在 X 轴上显示时间/日期的图,用户可以
在 PowerShell 中,您可以格式化日期以返回当前小时,如下所示: Get-Date -UFormat %H 您可以像这样在 UTC 中获取日期字符串: $dateNow = Get-Date
我正在尝试使用 Javascript 向父子窗口添加一些页面加载检查功能。 我的目标是“从父窗口”检测,每次子窗口完全加载然后执行一些代码。 我在父窗口中使用以下代码示例: childPage=wi
我正在尝试设置此 FFmpeg 命令的 drawtext 何时开始,我尝试使用 start_number 但看起来它不会成功。 ffmpeg -i 1.mp4 -acodec aac -keyint_
我收到了一个 Excel (2010) 电子表格,它基本上是一个文本转储。 单元格 - J8 具有以下信息 2014 年 2 月 4 日星期二 00:08:06 EST 单元格 - L8 具有以下信息
我收到的原始数据包含一列具有以下日期和时间戳格式的数据: 2014 年 3 月 31 日凌晨 3:38 单元格的格式并不一致,因为有些单元格有单个空格,而另一些单元格中有两个或三个字符之间的空格。所以
我想知道是否有办法在我的 Grails 应用程序顶部显示版本和构建日期。 编辑:我应该说我正在寻找构建应用程序的日期/时间。 最佳答案 在您的主模板中,或任何地方。 Server version:
我是一名优秀的程序员,十分优秀!