gpt4 book ai didi

olap-cube - 电信数据的 OLAP Cube 设计问题

转载 作者:行者123 更新时间:2023-12-02 23:16:00 26 4
gpt4 key购买 nike

背景:我正在分析通话详细记录 (CDR) 数据,以便根据通话时长、通话时间(节假日通话或非节假日通话、商务通话)对客户进行分割或非商务电话)、用户年龄组和性别。数据来自两个表名cdr(包括card_number、service_key、c​​alling、called、start_time、clear_time、duration列)subscriber_detail(包括subscriber_name、subscriber_address、DOB、gender列)我设计了 OLAP,如下所示。

enter image description here

Call_date 包括通话日期以及年、月和日。 Call_time 是调用发生的时间(以秒为单位)。

问题:-如果我们以秒为单位的 call_time ,那么它每天有 86400 列(可能是维数灾难),因此我们认为通过采用 30 秒时间脉冲(电信)来减少其维数根据脉冲收费,30 是我们上下文中的脉冲持续时间)。 第一个问题是:-这是用脉冲持续时间代替时间的最佳方法吗? 第二个是:-如果一个订户在脉冲范围内进行两次以上调用,则可能会导致问题,即第一个调用在 21:01:00 开始,在 21:01:05 结束,然后他开始第二个调用21:01:15 调用,21:01:20 结束。如何解决此类问题。

最佳答案

如果我是你,我会将时间划分为 10 分钟时段,并使用链接列表来存储给定时段内的多个持续时间,因此时间的总维度为 144(这限制最多只能滚动 10 分钟)。

关于olap-cube - 电信数据的 OLAP Cube 设计问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15102752/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com