python - onehotencoder 的用法-6ren

python - onehotencoder 的用法

转载作者：太空宇宙更新时间：2023-11-03 17:13:39

26

4

我是Python新手。我之前只有VBA代码。最近开始使用python进行数据挖掘，但使用python时遇到了问题

我在使用 onehotencoder 正确转换我的类别功能时遇到问题，这是我的代码

from __future__ import print_function
import os import subprocess from sklearn.preprocessing import OneHotEncoder
from sklearn import preprocessing import csv    
import pandas as pd import numpy as np
from sklearn.tree import DecisionTreeClassifier, export_graphviz     

datapoint = []    
with open('raw2.csv',  'rb') as csvfile:    
    spamreader = csv.reader(csvfile, delimiter=',')    
    for row in spamreader: # Reading each row    
        data_point = []    
        for column in row: # Reading each column of the row    
            data_point.append((column))    
        datapoint.append(data_point)    
datapoint = np.array(datapoint)   

print(datapoint)
enc = preprocessing.OneHotEncoder()
enc.fit(datapoint)
enc.transform(datapoint).toarray()

features = list(df.columns[1:8])
print("* features:", features, sep="\n")
"#fit the decision tree"
y = df[,0]
X = df[features]
dt = DecisionTreeClassifier(min_samples_split=5, random_state=51)
dt.fit(X, y)

""produce graphic visualization""
def visualize_tree(tree, feature_names):
    """Create tree png using graphviz.

    Args
    ----
    tree -- scikit-learn DecsisionTree.
    feature_names -- list of feature names.
    """
    with open("dt.dot", 'w') as f:
        export_graphviz(tree, out_file=f,
                        feature_names=feature_names)

    command = ["dot", "-Tpng", "dt.dot", "-o", "dt.png"]
    try:
        subprocess.check_call(command)
    except:
        exit("Could not run dot, ie graphviz, to "
             "produce visualization")

visualize_tree(dt, features)

这是我的第一个数据集的示例

['Tobermory' 'Car' '2-3hr' 'Fall' '<$100' '3 days' 'Male' '18 - 23']

这是我遇到的错误

ValueError                                Traceback (most recent call
last) <ipython-input-13-0bb2597d0276> in <module>()        
      25 enc = preprocessing.OneHotEncoder()    
 ---> 26 enc.fit(datapoint)    
      27 enc.transform(datapoint).toarray()    

ValueError: invalid literal for int() with base 10: 'Tobermory'

最佳答案

我相信您正在寻找sklearn.preprocessing.LabelBinarizer。OneHotEncoder 接受一个整数并从中创建虚拟变量。

http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelBinarizer.html

关于python - onehotencoder 的用法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33851028/

26

4

0

文章推荐： python - 使用 Python Pandas 取消透视/堆叠透视表

文章推荐： arrays - Ruby，Array.select 与元素的数量

文章推荐： python - 从向导打印报告中的参数

文章推荐： ruby-on-rails - 在 Ruby 中将 snake case 转换为普通句子

cookies - 移动应用程序 - Cookie 法
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 6年前关闭。 Improve this qu
java - 实体惰性方法和 Dimetra 法
我有实体: @Entity @Table(name = "CARDS") public class Card { @ManyToOne @JoinColumn(name = "PERSON_I
javascript - 计算多边形的法向量 - Newells 法
我正在尝试计算二维多边形的表面法线。我正在使用 OpenGL wiki 中的 Newell 方法来计算表面法线。 https://www.opengl.org/wiki/Calculating_a_S
jquery - 着陆页上的谷歌分析代码和 cookie 法
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 7 年前。 Improve
android - 移动应用程序是否需要遵守欧盟 Cookie 法？
关闭。这个问题是off-topic .它目前不接受答案。想改进这个问题吗？ Update the question所以它是on-topic用于堆栈溢出。关闭 9 年前。 Improve this
ruby - Nokogiri child 法
我这里有以下 XML: Visa, Mastercard, , , , 0, Discover, American Express siteonly, Buyer Pay
Android - 欧盟 Cookie 法
即将发生的 Google 政策变更迫使我们实现一个对话框，以通知欧盟用户有关 Cookie/设备标识符用于广告和分析的情况。我只想向欧盟用户显示此对话框。我不想使用额外的权限(例如 android.p
华为云大咖说：开发者应用AI大模型的“道、法、术”
本文分享自华为云社区《华为大咖说 | 企业应用AI大模型的“道、法、术” ——道：认知篇》，作者：华为云PaaS服务小智。本期核心观点上车：AGI是未来5～10年内，每个人都无法回避的技
asp.net - 关于年龄验证的 Cookie 法
我有一个与酒精相关的网站，需要先验证年龄，然后才能让他们进入该网站。我使用 HttpModule 来执行此操作，该模块检查 cookie，如果未设置，我会将它们重定向到验证页面。我验证他们的年龄并存储
javascript - 自动选择加入 cookie 的浏览器插件 - 欧盟 cookie 法
在欧盟，我们有一项法律，要求网页请求存储 cookie 的许可。我们大多数人都了解 cookie 并同意它们，但仍然被迫在任何地方明确接受它们。所以我计划编写这个附加组件(ff & chrome)，它
c++ - 在 C/C++ 中声明函数然后定义它是否内 union 法？
以下在 C 和/或 C++ 中是否合法？ void fn(); inline void fn() { /*Do something here*/ } 让我担心的是，第一个声明看起来暗示函数将被定义

首页

博学

6Ren·AI

商城

python - onehotencoder 的用法