gpt4 book ai didi

pandas使用get_dummies进行one-hot编码的方法

转载 作者:qq735679552 更新时间:2022-09-27 22:32:09 25 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章pandas使用get_dummies进行one-hot编码的方法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码 。

2、离散特征的取值有大小的意义,比如size:[x,xl,xxl],那么就使用数值的映射{x:1,xl:2,xxl:3} 。

使用pandas可以很方便的对离散型特征进行one-hot编码 。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import pandas as pd
df = pd.dataframe([
    [ 'green' , 'm' , 10.1 , 'class1' ],
    [ 'red' , 'l' , 13.5 , 'class2' ],
    [ 'blue' , 'xl' , 15.3 , 'class1' ]])
 
df.columns = [ 'color' , 'size' , 'prize' , 'class label' ]
 
size_mapping = {
    'xl' : 3 ,
    'l' : 2 ,
    'm' : 1 }
df[ 'size' ] = df[ 'size' ]. map (size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate ( set (df[ 'class label' ]))}
df[ 'class label' ] = df[ 'class label' ]. map (class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'xl':3,'l':2,'m':1} 。

pandas使用get_dummies进行one-hot编码的方法

?
1
using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one - hot编码
?
1
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我.

原文链接:https://blog.csdn.net/lujiandong1/article/details/52836051 。

最后此篇关于pandas使用get_dummies进行one-hot编码的方法的文章就讲到这里了,如果你想了解更多关于pandas使用get_dummies进行one-hot编码的方法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com