c# - 根据类次列表创建时间表的摘要说明-6ren

c# - 根据类次列表创建时间表的摘要说明

转载作者：太空狗更新时间：2023-10-29 22:20:49

24

4

假设我有一个事件的类次列表(格式为开始日期/时间，结束日期/时间)-是否可以使用某种算法来创建时间表的概括性摘要？大多数轮类都陷入某种常见的复发模式是很常见的(例如，星期一从上午9:00到1:00 pm，星期二从10:00到3:00 pm，等等)。但是，该规则可能会有(并且将会有)异常(exception)情况(例如，其中一个类次是在假期休假，并已安排在第二天)。将这些内容排除在我的“摘要”中会很好，因为我希望提供有关此事件通常在何时发生的更一般的答案。

我想我正在寻找某种统计方法来确定日期和时间的发生，并根据列表中最常见的发生来创建描述。是否有某种适用于此类情况的通用算法？有没有人创造类似的东西？

理想情况下，我正在寻找C#或VB.NET的解决方案，但不介意从任何其他语言进行移植。

提前致谢!

最佳答案

您可以使用Cluster Analysis。
群集是一种将一组数据分离为相似组件(子集)的方法。 “相似性”概念涉及点之间的“距离”的一些定义。存在许多常用的距离公式，其中包括常用的欧几里得距离。
实际案例
在向您介绍该交易的怪癖之前，让我们为您的问题演示一个实际案例，以便您可以参与算法和程序包，或者预先丢弃它们。
为了简便起见，我在Mathematica中对问题进行了建模，因为软件中包括了聚类分析，并且设置起来非常简单。
首先，生成数据。格式为{DAY，START TIME，END TIME}。
开始时间和结束时间添加了一个随机变量(+半小时，零，-半小时}，以显示该算法应对“噪声”的能力。
有三天，每天三类，还有一个额外的(最后一个)“异常”类，开始于上午7点，结束于上午9点(可怜的家伙!)。
每个“正常”类次中有150个事件，而异常事件中只有两个。
如您所见，某些转变彼此之间相距不远。
如果您可以访问该软件，我会将代码包含在Mathematica中。我试图避免使用函数语法，以使“外国人”更容易阅读代码。
这是数据生成代码:

Rn[] := 0.5 * RandomInteger[{-1, 1}];

monshft1 = Table[{ 1 , 10 + Rn[] , 15 + Rn[] }, {150}];  // 1
monshft2 = Table[{ 1 , 12 + Rn[] , 17 + Rn[] }, {150}];  // 2
wedshft1 = Table[{ 3 , 10 + Rn[] , 15 + Rn[] }, {150}];  // 3
wedshft2 = Table[{ 3 , 14 + Rn[] , 17 + Rn[] }, {150}];  // 4
frishft1 = Table[{ 5 , 10 + Rn[] , 15 + Rn[] }, {150}];  // 5
frishft2 = Table[{ 5 , 11 + Rn[] , 15 + Rn[] }, {150}];  // 6
monexcp  = Table[{ 1 , 7  + Rn[] , 9  + Rn[] }, {2}];    // 7

现在我们结合数据，获得一个大数据集:

data = Join[monshft1, monshft2, wedshft1, wedshft2, frishft1, frishft2, monexcp];

让我们对数据进行聚类分析:

clusters = FindClusters[data, 7, Method->{"Agglomerate","Linkage"->"Complete"}]

“聚集”和“链接”->“完整”是在Mathematica中实现的聚类方法的两个微调选项。他们只是指定我们正在尝试找到非常紧凑的集群。
我指定尝试检测7个群集。如果未知正确的移位数，则可以尝试几个合理的值并查看结果，或者让算法选择更合适的值。
我们可以得到一个带有结果的图表，每个簇使用不同的颜色(不用管代码)

ListPointPlot3D[ clusters, 
           PlotStyle->{{PointSize[Large], Pink},    {PointSize[Large], Green},   
                       {PointSize[Large], Yellow},  {PointSize[Large], Red},  
                       {PointSize[Large], Black},   {PointSize[Large], Blue},   
                       {PointSize[Large], Purple},  {PointSize[Large], Brown}},  
                       AxesLabel -> {"DAY", "START TIME", "END TIME"}]

结果是:

您可以在其中清楚地看到我们的七个集群。
那解决了部分问题:识别数据。现在，您还希望能够对其进行标记。
因此，我们将获得每个聚类并采取均值(四舍五入):

Table[Round[Mean[clusters[[i]]]], {i, 7}]

结果是:

Day   Start  End
{"1", "10", "15"},
{"1", "12", "17"},
{"3", "10", "15"},
{"3", "14", "17"},
{"5", "10", "15"},
{"5", "11", "15"},
{"1",  "7",  "9"}

这样一来，您将再次获得七堂课。
现在，也许您想对转变进行分类，无论白天如何。如果同一个人每天在同一时间执行相同的任务，那么将其称为“星期一从10到15转变”是没有用的，因为它也发生在星期三和星期五(在我们的示例中)。
让我们分析不考虑第一列的数据:

clusters=
 FindClusters[Take[data, All, -2],Method->{"Agglomerate","Linkage"->"Complete"}];

在这种情况下，我们没有选择要检索的簇数，而是将决定权交给了程序包。
结果是

您可以看到已识别出五个集群。
让我们尝试像以前一样“标记”它们:

Grid[Table[Round[Mean[clusters[[i]]]], {i, 5}]]

结果是:

 START  END
{"10", "15"},
{"12", "17"},
{"14", "17"},
{"11", "15"},
{ "7",  "9"}

这正是我们“怀疑”的内容:每天同一时间有重复的事件可以组合在一起。
编辑:隔夜类次和规范化
如果您有(或计划有)从一天开始到下一天结束的类次，最好进行建模

{Start-Day Start-Hour Length}  // Correct!

比

{Start-Day Start-Hour End-Day End-Hour}  // Incorrect!

这是因为，与任何统计方法一样，必须明确变量之间的相关性，否则该方法将失败。该原理可以运行“使您的候选数据标准化”之类的东西。这两个概念几乎相同(属性应该是独立的)。
-编辑结束-
到目前为止，我想您已经很了解这种分析方法可以做什么。
一些引用

当然，Wikipedia，其“引用”和“更多阅读”是不错的指南。

一个不错的视频here，展示了Statsoft的功能，但是您可以在其中找到很多
关于您可以使用该算法进行其他操作的想法。

Here是

涉及的算法的基本解释

Here您可以找到R令人印象深刻的功能来进行聚类分析(R是非常好的选择)

最后，在here中，您可以找到一长串免费的和商业的统计软件，这些软件通常用于统计，包括聚类。

HTH!

关于c# - 根据类次列表创建时间表的摘要说明，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/3165867/

24

4

0

文章推荐： python - numpy.unique 基于计数的排序

文章推荐： python - 使用 MultiIndex 过滤

文章推荐： python - opencv 对象跟踪的边界框定义

文章推荐： python - 从 Tensorflow 中的多个 tf.data.Datasets 中随机抽样

Jquery 说明 >*
我正在查看预先重写的 jQuery 代码。我无法理解以下代码。 $('body > *:not(#print-modal):not(script)').clone(); 最佳答案此选择器匹配以下任何
MySQL 说明
所以我开始学习MySQL，我对表有点困惑，所以我想澄清一下。数据库中可以有多个表吗？例如: Database1 -Table1 -Username -Password -Table2 -Name
PostgreSQL 说明
我在 PostgreSQL 中编写了一个函数，其代码如下: for (i = 0; i str[0][i]); values[i] = datumCopy(dat_value,
PostgreSQL中的OID和XID 说明
oid：行的对象标识符（对象 ID）。这个字段只有在创建表的时候使用了 WITH OIDS ，或者是设置了default_with_oids 配置参数时出现。这个字段的类型是 oid （和字段同
android - 附近连接最大连接设备 - 说明
我在搜索最大连接设备数时发现了 a post大致说: 当使用 P2P_STAR 时，最大设备数量为 10，因为此 topoly 使用 Wi-Fi 热点。也就是说，如果您没有路由器。这让我问了两个问题
ocaml sprintf 说明
我不明白为什么会这样: Printf.sprintf "%08s" "s" = Printf.sprintf "%8s" "s" - : bool = true 换句话说，我希望: Printf.sp
Grails addTo* 说明
我正在遵循 Grails in Action 中的示例。我有一个问题，如何理解 addTo*()功能有效。我有一个简单的域:具有以下关系的用户、帖子、标签: 用户1对M发帖用户一对一标签发布 M
C# OOPS 说明
请问为什么行 "b[0]= new Child2();"在运行时而不是在编译时失败。请不要检查语法，我只是在这里做了 class Base {} class Child1 : Base {} clas
sockets - 创建RAW套接字教程/说明？
所以我想进一步加深我对套接字的理解，但是我想首先从最低级别开始(在C语言中，而不是在汇编中大声笑) 但是，我处理的大多数站点都使用SOCK_STREAM或SOCK_DGRAM。但是我已经阅读了Beej
处理空值的 JavaScript 说明
好吧，我对 javascript 语法了解甚少，而且我对 null 的行为感到非常困惑。关于空值有很多讨论，但我似乎无法找出问题所在!请帮我。这是脚本。 var jsonData = '';
javascript - 说明【随机列表】
关闭。此题需要details or clarity 。目前不接受答案。想要改进这个问题吗？通过 editing this post 添加详细信息并澄清问题. 已关闭5 年前。 Improve thi
java - 幂和阶乘级数和说明
问题: SeriesSum 类旨在计算以下系列的总和: 类名:SeriesSum 数据成员/实例变量: x:存储整数 n:存储术语数量 sum:用于存储系列总和的双变量成员函数: SeriesSum
java - 作业概览说明
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
java - endAllStagingAnimators 说明
今天我在 logcat 中注意到以下内容: D/OpenGLRenderer:0xa2c70600 (CardView) 上的 endAllStagingAnimators，句柄为 0xa2c9d35
java - 说明数组列表
如何创建值有序对的列表，例如list1 [(x, y), (x1, y1) ...].?? 学习如何创建此列表后，我需要知道如何将 x 值提供给列表中的用户输入并搜索 x 的下一个值并显示有序对 (x
SQL - 说明 - ISNULL()
我在存储过程中有以下逻辑。这里完成了什么？如果color为null，替换为'' IF ISNULL(@color, '') <> '' BEGIN END 最佳答案它等同于: IF (@colo
.net接口(interface)说明
我知道.Net中的接口(interface)定义了接口(interface)和继承它的类之间的契约。刚刚完成了一个大量使用数据访问层接口(interface)的项目，这让我开始思考。 . .有什么大不
c# - OOP 说明
如何防止基类方法被子类覆盖最佳答案您不需要做任何特别的事情:默认情况下方法是不可覆盖的。相反，如果您希望该方法可重写，则必须将 virtual 关键字添加到其声明中。但是请注意，即使方法不可重写
java - 工厂模式设计——说明
我已阅读以下有关工厂模式的文章 here 请仅引用Class Registration - avoiding reflection这一部分。这个版本在没有反射的情况下实现了工厂和具体产品之间的减少耦
java - For-Each 循环替代方案 - 说明
我正在学习 Java 类(class)，但无法完全理解下一课的内容。目的:本课的目的是通过创建一个模拟 for-each 循环如何工作的替代方案来解释 for-each 循环的工作方式。在上一课中

首页

博学

6Ren·AI

商城

c# - 根据类次列表创建时间表的摘要说明