gpt4 book ai didi

machine-learning - 聚合一热编码

转载 作者:行者123 更新时间:2023-11-30 09:15:27 24 4
gpt4 key购买 nike

我收集了每小时的天气预报数据。我收集的特征是数字-“温度”、“降水”以及分类-“天气预测”(例如“晴朗”、“晴朗”、“阴天”、“下雨”、“大雨”等)。我需要创建每日天气预报统计数据。虽然对于数字特征来说很容易(最小值、最大值、平均值、标准差等),但我在如何处理分类数据方面遇到了一些困难。我正在考虑对每小时的“weather_forecast”功能进行一次热编码,然后将这些值加在一起。

例如,对于以下数据:

hour      weather_forecast
8:00 sunny
9:00 sunny
10:00 sunny
11:00 cloudy
12:00 rain
13:00 cloudy

在一个热编码中

       sunny     cloudy     rain
8:00 1 0 0
9:00 1 0 0
10:00 1 0 0
11:00 0 1 0
12:00 0 0 1
13:00 0 1 0

我会得到类似的统计数据

sunny: 3
cloudy: 2
rain: 1

这可能会让我获得有关一天天气的汇总统计数据。

我想知道这种方法是否存在任何陷阱/问题或需要注意的事项。这个编码有名字吗(我在网上找不到)。

最佳答案

当您对weather_forecast应用one-hot编码时,您的编码就完成了。总和仅显示天气晴朗、阴天等的小时数。

如果您将统计数据除以总小时数,您将收到一段时间内(例如一天)天气类型的百分比。我认为没什么特别的问题。

关于machine-learning - 聚合一热编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57191157/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com