gpt4 book ai didi

pandas - sklearn : Found input variables with inconsistent numbers of samples: [1, 99]

转载 作者:行者123 更新时间:2023-12-03 13:58:01 25 4
gpt4 key购买 nike

我正在尝试用 spyder 中的 Pandas 构建一个简单的回归线。
执行以下代码后,我收到此错误:

Found input variables with inconsistent numbers of samples: [1, 99]
编码:
import numpy as np
import pandas as pd

dataset = pd.read_csv('Phil.csv')

x = dataset.iloc[:, 0].values
y = dataset.iloc[:, 2].values

from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(x, y)
我想我知道问题出在哪里,但我不太确定如何处理语法。
在变量资源管理器中,x(和 y)的大小是 (99L,),据我所知,它不能是向量,必须是大小 (99,1)。
y 也一样。
看到一堆相关的话题,但没有一个有帮助。

最佳答案

引用 LinearRegression 的 sklearn 文档( http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegression.fit ), X vector 需要符合规范 [n_samples,n_features] .

由于您只有一个包含多个样本的特征,因此形状应该是 (99,1) - 例如,每个“行”有一个值,只有一个“列”。

有很多方法可以做到这一点(引用: Efficient way to add a singleton dimension to a NumPy vector so that slice assignments work ),在您的情况下,以下应该有效:

regressor.fit(x[:, None], y)

别忘了 predict需要与数据相同的形状!

关于pandas - sklearn : Found input variables with inconsistent numbers of samples: [1, 99],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45697427/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com