gpt4 book ai didi

Python,针对频繁模式的网络日志数据挖掘

转载 作者:太空狗 更新时间:2023-10-30 03:07:51 27 4
gpt4 key购买 nike

我需要开发一个用于网络日志数据挖掘的工具。

有许多 url 序列,在特定用户 session 中请求(从网络应用程序日志中检索),我需要弄清楚网站用户的使用模式和组(集群)。

我是数据挖掘的新手,现在经常研究 Google。找到一些有用的信息,即查询 Frequent Pattern Mining in Web Log Data似乎指向几乎完全相似的研究。

所以我的问题是:

  1. 是否有任何基于 python 的工具可以满足我的需求或至少类似?
  2. 可以Orange toolkit有什么帮助吗?
  3. 可以看书 Programming Collective Intelligence有什么帮助吗?
  4. 用 Google 搜索什么,阅读什么,最好使用哪种相对简单的算法?

我的时间非常有限(一周左右),所以任何帮助都将非常宝贵。我需要的是为我指明正确的方向,以及如何在最短的时间内完成任务的建议。

提前致谢!

最佳答案

1&2:Orange有一个频繁模式挖掘模块。它还支持集群。

3.刚刚查了一下书的内容。没有频繁模式挖掘的章节。总之,对于数据挖掘的初学者来说,总体来说是一本不错的书。您会发现它对帮助您准确定义问题非常有用。

4.需要了解聚类、频繁模式挖掘/关联规则挖掘的输入输出。所以google这些算法,或者找一本好的数据挖掘教科书阅读。

关于Python,针对频繁模式的网络日志数据挖掘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2925555/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com