gpt4 book ai didi

python - 机器学习的数据分离

转载 作者:太空狗 更新时间:2023-10-30 01:19:18 26 4
gpt4 key购买 nike

我已经为机器学习项目导入了一个数据集。我需要第一个输入层中的每个“神经元”都包含一个数字数据。但是,我一直无法做到这一点。这是我的代码:

import math
import numpy as np
import pandas as pd; v = pd.read_csv('atestred.csv',
error_bad_lines=False).values
rw = 1
print(v)
for x in range(0,10):
rw += 1
s = (v[rw])
list(s)
#s is one row of the dataset
print(s)#Just a debug.
myvar = s
class l1neuron(object):
def gi():
for n in range(0, len(s)):
x = (s[n])
print(x)#Just another debug
n11 = l1neuron
n11.gi()

我最理想的是它的一个变体,其中代码为它从数据中提取的每一行创建一个新变量(我在第一个循环中尝试做的),并为提取的每条数据创建一个新变量从每一行(我在类和第二个循环中尝试做的事情)。

如果我的代码完全遗漏了要点,请随时为我指明正确的方向以进行完整的重写。

这是我的数据集的前几行:

fixed acidity;"volatile acidity";"citric acid";"residual sugar";"chlorides";"free sulfur dioxide";"total sulfur dioxide";"density";"pH";"sulphates";"alcohol";"quality"
7.4;0.7;0;1.9;0.076;11;34;0.9978;3.51;0.56;9.4;5
7.8;0.88;0;2.6;0.098;25;67;0.9968;3.2;0.68;9.8;5
7.8;0.76;0.04;2.3;0.092;15;54;0.997;3.26;0.65;9.8;5

提前致谢。

最佳答案

如果我很好地理解您的问题,您希望将 csv 表中的每一行转换为一个单独的变量,该变量又保存该行的所有值。这是您可能如何处理此问题的示例。有很多方法可以达到这个目的,其他方法可能更高效、更快、更像 python 、更时髦等等。但编写下面的代码是为了帮助您了解如何将表格数据存储到命名变量中。

两点说明:

  1. 如果读取数据是您唯一需要 pandas 的事情,您可能会寻找一个不太复杂的解决方案
  2. L1Neuron 类不是很透明,因为它的成员不能从代码中读取,而是通过 attrs 中的变量列表在运行时创建。您可能想看看 namedTuples而是为了更好的可读性。

`

import pandas as pd 
from io import StringIO
import numbers


# example data:
atestred = StringIO("""fixed acidity;volatile acidity;citric acid;\
residual sugar;chlorides;free sulfur dioxide;total sulfur dioxide;\
density;pH;sulphates;alcohol;quality
7.4;0.7;0;1.9;0.076;11;34;0.9978;3.51;0.56;9.4;5
7.8;0.88;0;2.6;0.098;25;67;0.9968;3.2;0.68;9.8;5
7.8;0.76;0.04;2.3;0.092;15;54;0.997;3.26;0.65;9.8;5
""")



# read example data into dataframe 'data'; extract values and column names:
data = pd.read_csv(atestred, error_bad_lines=False, sep=';')
colNames = list(data)



class L1Neuron(object):
"neuron class that holds the variables of one data line"

def __init__(self, **attr):
"""
attr is a dict (like {'alcohol': 12, 'pH':7.4});
every pair in attr will result in a member variable
of this object with that name and value"""
for name, value in attr.items():
setattr(self, name.replace(" ", "_"), value)

def gi(self):
"print all numeric member variables whose names don't start with an underscore:"
for v in sorted(dir(self)):
if not v.startswith('_'):
value = getattr(self, v)
if isinstance(value, numbers.Number):
print("%-20s = %5.2f" % (v, value))
print('-'*50)


# read csv into variables (one for each line):
neuronVariables = []
for s in data.values:
variables = dict(zip(colNames, s))
neuron = L1Neuron(**variables)
neuronVariables.append(neuron)

# now the variables in neuronVariables are ready to be used:
for n11 in neuronVariables:
print("free sulphur dioxide in this variable:", n11.free_sulfur_dioxide, end = " of ")
print(n11.total_sulfur_dioxide, "total sulphur dioxide" )
n11.gi()

关于python - 机器学习的数据分离,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48037509/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com