- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
我想用 Java 编写一个“智能监视器”,它会在它检测到即将出现的性能问题时发出警报。我的 Java 应用正在将结构化格式的数据写入日志文件:
<datetime> | <java-method> | <seconds-to-execute>
因此,例如,如果我有一个执行时间为 812 毫秒的 Widget#doSomething(String)
方法,它将被记录为:
2013-03-24 11:39:21 | Widget#doSomething(String) | 812
随着性能开始下降(例如在主要收集期间、峰值负载期间或系统只是缓慢爬行),方法执行时间开始减慢;所以最右边的列开始看到巨大的数字(有时执行一个方法需要 20 到 40 秒)。
在大学里——为了一个机器学习练习——我写了我的教授所说的线性二分法,它采用简单的测试数据(一个人的高度、体重和性别)并“学习”了如何根据高度/体重将一个人分类为男性或女性。然后,一旦它拥有了所有的训练数据,我们就给它提供了新的数据,看看它可以多准确地确定性别。
我认为线性二分法的多元版本叫做support vector machine (SVM) .如果我错了,请澄清一下,我会将问题的标题更改为更合适的名称。 无论如何,我需要这个应用来做以下事情:
java-method
和 seconds-to-execute
列作为输入/测试数据很重要;我不在乎日期时间需要注意的是,seconds-to-execute
列并不是这里唯一重要的因素,因为我已经看到某些方法在性能出色的时期的可怕时机,以及非常好的时机对于其他方法,有时服务器似乎即将死亡并插入雏菊。所以很明显某些方法是“加权的”/比其他方法对性能更重要。
最佳答案
您描述的“智能监视器”正是时间序列分类。
有很多分类算法。它们基本上都采用一个矩阵,其中行是观察结果,列是以某种方式描述观察结果的“特征”,以及长度为 0 或 1 的行的标签 vector 。在您的问题中,观察结果可能是一个微小的样本,并且您的标签 vector 在遇到性能问题的时间段内的值为 1,否则为 0。
此定义隐含需要对数据重新采样(必要时使用众数/中值/平均值),以便均匀地定义每个观察值,例如秒、分钟或小时。
生成特征是关键部分。我可能会从 2 个特征开始,即观察 x_i 和 x_i-1 之间的原始值和(一次)差异值。我们将这些定义为滞后 2。从技术上讲,这 4 个特性。每个功能都无法展望 future 。对于每次观察,每个特征都必须代表相同的事物。
例如考虑长度为 10 的时间序列:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
如果我们想在过去使用滞后两个间隔生成一组特征,那么时间序列的前两个元素被认为是老化样本。我们不能使用与它们相关的观察来训练算法。
8 行 2 列的原始值将是
[[ 1., 0.]
[ 2., 1.],
[ 3., 2.],
[ 4., 3.],
[ 5., 4.],
[ 6., 5.],
[ 7., 6.],
[ 8., 7.]]
差异值
[[ 1., 1.],
[ 1., 1.],
[ 1., 1.],
[ 1., 1.],
[ 1., 1.],
[ 1., 1.],
[ 1., 1.]])
这些将列堆叠。您可以探索许多其他功能。 Rolling mean将是我的下一个选择。
如果您想进一步预测 future ,那么您的训练数据应该比您的标签 vector 滞后。
如果性能不令人满意,请尝试通过在更大的窗口上选择滚动平均值来添加更多功能,或者在将来添加更多功能。提高时间序列算法性能的一个巧妙技巧是包含前一个时间间隔的预测值。
将您的分类器拟合到数据的早期部分,然后观察其在数据后期部分的准确性。您可以使用许多分类器指标。如果您选择使用输出概率而不是硬 1/0 的分类器,那么您的选择范围甚至会扩大。 (就像分类器的用途一样。)
Precision and recall是分类器的直观性能指标。
对数据的前半部分(早期)进行训练并在后半部分(稍后)进行测试。
就算法而言,我会研究逻辑回归。如果性能不令人满意并且您已经用尽了特征提取选项,我只会寻找其他地方。
Mallet似乎是该任务的一个很好的库。 See this bit of the docs.
我最近发现了JSAT ,看起来很有希望。
有更具体的时间序列分类方法明确考虑了观察和标签的顺序性质。这是对时间序列的分类的通用改编。
关于java - Java的支持 vector 机?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15625359/
我的 processmaker 安装遇到了一些问题。我正在尝试使用本指南 [url]http://wiki.processmaker.com/index.php/ProcessMaker_Ubuntu
我正在使用 ShareKit。发送 SMS 消息使用 MFMessageComposeViewController,用户看到标题“文本”。我想将该标题更改为更能反射(reflect)实际可用内容的内容
我需要在我的一个针对 Gingerbread 的 Android 应用程序中使用操作栏和 fragment 的组合。所以我使用了 v7 支持库中的操作栏和 v4 支持库中的 fragment ,并使用
我明白为什么浏览器 vendor 不想帮助我阻止他们的 UI 线程。但是,我不明白为什么会有: Web Workers 中没有 sleep (2) 没有同步 WebSockets API 有一个syn
最近我的组织正在考虑使用 Docker。我们组使用的是cloudera CDH 5.1.2。 1) cloudera 是否与 Docker 容器兼容?2) docker 和cloudera 组合是否存
我正在尝试通过编译在 Mac 上安装 rsync 3.2.3。但是,我想安装所有功能。为此,它需要一些库,此处 ( https://download.samba.org/pub/rsync/INSTA
我一直在使用 PyDev 成功运行 nose 测试,并想试试 nose2。 所以我安装了它 pip install nose2 复制/粘贴来自 http://nose2.info/ 的示例代码进入名为
我想知道 LLVM 中是否有任何函数/方法可以在 LLVM IR 中添加 Open-MP 构造。 llvm-3.0 是否仍然支持 OpenMP 指令? 最佳答案 OpenMP 是一种高级语言扩展。因此
我对 CUDA 编程非常陌生。我正在浏览 SDK 附带的示例。我能够编译代码,但是当我运行它时,出现以下错误: "clock.cu(177) : CUDA Runtime API error 38:
RStudio 是用于 R 开发的出色 IDE。我想知道是否有任何方法可以很好地支持 HiDPI 分辨率? 我目前有 13 英寸显示器和 3200x1800 分辨率,甚至很难阅读 RStudio 选项
我正在寻找一种有助于为 Django 项目提供 RDF 支持的工具。 到目前为止,我发现了两个: django-rdf - 最后一次修改是在 4 年前,所以它看起来像是一个死项目。 djubby -
我刚刚尝试了一些 JS 核心原则,发现引擎评估链接的关系运算符而不会引发错误。相反,他们以我自己无法理解的方式进行评估。 console.log(1 4 > 3 > 2 > 1); //false,
我知道 etexteditor 和 vim/emacs。 是否有任何其他 Windows 编辑器支持类似 textmate 的片段(例如,您编写触发词,按 Tab,它更改为某些内容,再次按 Tab,它
我正在尝试找出验证给定集群的网络策略配置的最佳方法。 According to the documentation Network policies are implemented by the ne
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
Z3 会支持 AUFBV 吗? 对于以下脚本: (set-logic AUFBV) (declare-fun x () (_ BitVec 16)) (declare-const t (Array (
使用分部类编写 NUnit 测试的优缺点是什么? 我要开始了: 亲:可以测试私有(private)方法 缺点:TDD 不再可能了 还有什么? 最佳答案 缺点:要么您必须测试与您发布的版本不同的构建,要
它很容易(对于 90% 的 aop 特性)在没有任何语言本身支持的情况下做到这一点,就像大多数动态语言如 python 和 ruby 一样。然而,Dojo在 1.3.2 上直接支持它.最新版本发生
我在我的 android 应用程序中使用亚洲字符,我已经了解到某些字符无法显示,因为系统字体不支持它们。我查询了一个包含亚洲字符的数据库,并且经常检索到无法显示的标志。这些情况对我的应用程序来说通常不
你好,我想实现一个控件,我想在用户键入@字符时启用该控件,直到未填充运行文本中的空格为止,它应该显示用户列表,@符号后键入的文本应该显示基于键盘字符的建议,就像我们在上面看到的那样Twitter 或
我是一名优秀的程序员,十分优秀!