python - 当我运行该程序时，我不断收到此错误。我已经尝试了我能想到的一切，但仍然不起作用-6ren

python - 当我运行该程序时，我不断收到此错误。我已经尝试了我能想到的一切，但仍然不起作用

转载作者：行者123 更新时间：2023-12-01 06:41:18

24

4

我正在尝试这个 NCAA 篮球预测程序，但我不断收到此错误:

Traceback (most recent call last):
  File "/mnt/chromeos/removable/JACKS JUNK/Chatbot_2/sports_predict.py", line 17, in <module>
    X_train, X_test, y_train, y_test = train_test_split(X, y)
  File "/home/jackmdavis06/.local/lib/python3.5/site-packages/sklearn/model_selection/_split.py", line 2116, in train_test_split
    arrays = indexable(*arrays)
  File "/home/jackmdavis06/.local/lib/python3.5/site-packages/sklearn/utils/validation.py", line 237, in indexable
    check_consistent_length(*result)
  File "/home/jackmdavis06/.local/lib/python3.5/site-packages/sklearn/utils/validation.py", line 212, in check_consistent_length
    " samples: %r" % [int(l) for l in lengths])
ValueError: Found input variables with inconsistent numbers of samples: [2258, 4148]

这是我的代码:

import pandas as pd
from sportsreference.ncaab.teams import Teams
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split

FIELDS_TO_DROP = ['away_points', 'home_points', 'date', 'location',
                  'losing_abbr', 'losing_name', 'winner', 'winning_abbr',
                  'winning_name', 'home_ranking', 'away_ranking']


teams = Teams()


dataset = pd.read_csv('data.csv')
X = dataset.drop(FIELDS_TO_DROP, 1).dropna().drop_duplicates()
y = dataset[['home_points', 'away_points']].values
X_train, X_test, y_train, y_test = train_test_split(X, y)

parameters = {'bootstrap': False,
                'min_samples_leaf': 3,
                'n_estimators': 50,
                'min_samples_split': 10,
                'max_features': 'sqrt',
                'max_depth': 6}
model = RandomForestRegressor(**parameters)
model.fit(X_train, y_train)
print(model.predict(X_test).astype(int), y_test)

我按照该网站上的指南进行操作:

https://towardsdatascience.com/predict-college-basketball-scores-in-30-lines-of-python-148f6bd71894

我稍微调整了代码以使其运行得更快，所以我尝试运行原始代码并且仅运行原始代码，但我得到了完全相同的错误。请帮忙!谢谢!

最佳答案

您删除了 X 的空值和重复项，但没有删除 y。如果您 print(X.shape[0], len(y))，您将看到它们具有不同的值。

你应该这样做:


#...
dataset = pd.read_csv('data.csv')

# drop nulls and dublicates
# use fields to keep for your analysis both features and target
# e.g. FIELDS_TO_KEEP = ['a', 'b' ...]
dataset = dataset[FIELDS_TO_KEEP].dropna().drop_duplicates()

# get your feature X, target y
X = dataset[FIELDS_THAT_ARE_FEATURES]
y = dataset[['home_points', 'away_points']]

# ...

关于python - 当我运行该程序时，我不断收到此错误。我已经尝试了我能想到的一切，但仍然不起作用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59446241/

24

4

0

文章推荐： python - 值错误: invalid literal for int() with base 10: '–20'

文章推荐： python - 如何获取 cartopy 大地测量图的转换数据？

文章推荐： java - 将字符串中的 [] 替换为 ()

c++ - 当我运行C++程序时，它返回某种数字
This question already has an answer here: Character constant too long for it's type (1个答案) 1年前关闭。我是
每次运行同一个 Scala 程序时，Eclipse 都会创建多个运行配置
每次我执行 Scala 程序时，Eclipse 都会创建一个新的“运行配置”。这样做的问题是我需要自定义默认的运行配置(需要更改工作路径)。因此，我第一次创建和自定义运行配置时一切正常，但任何后续尝试
java - 在记录 Java 程序时，记录类的约定是什么？
关闭。这个问题是opinion-based 。目前不接受答案。想要改进这个问题吗？更新问题，以便 editing this post 可以用事实和引文来回答它。 . 已关闭 5 年前。 Improv
java - 当我的应用程序打开一个新的 java 程序时，如何防止我的应用程序使用新主题重新绘制自身？
基本上我正在做的是创建一个充当启动器的 swing 应用程序。它所做的只是为用户提供了 3 个选项，他们可以从中选择打开一个新的 java 应用程序。 3 个不同的 java 应用程序都有不同的主题，
python - 当我运行 python 程序时，如何阻止命令提示符窗口打开？
这个问题已经有答案了: Make a py2exe exe run without a console? (2 个回答) 已关闭 9 年前。我不希望在打开 python 应用程序时在后台打开 cmd
c - 为什么当我尝试通过创建一个以程序命名的文件来编译我的 C 程序时，它会为其创建一个应用程序？
我曾经尝试编译一个我为国际象棋游戏编写的 C 程序(感谢 YouTube 的 Bluefever Software 提供的教程)，但是当我去编译该程序时，我执行了这行代码: C:\TDM-GCC-64
c - 运行以下文件处理 C 程序时，为什么输出不符合预期？
这是一段代码，通过从一个文件获取输入并在另一个文件中给出输出来执行数字的平方。 #include #include void main() { FILE *fp1, *fp2; char
c++ - 当我运行这个 C++ 程序时，这个函数调用了什么？
#include using namespace std; class foo { private: static int cnt; // number in memory stat
c++ - 调试visual c++程序时，指定的文件无法执行
我做了一个简单的 hello world 程序。我单击“开始调试”，窗口显示“项目已过期。您要构建它吗？”当我单击"is"时，下一个窗口显示“存在构建错误。您要继续并运行上次成功的构建吗？”。我再次选
c++ - 当我尝试编译这个 C++ 程序时，它给了我一个错误
这是一个程序，有人在其中输入密码并尝试三次猜密码。当我编译它时，我遇到了多个错误，其中一个包括第 13 行，它基本上说它找不到包含在 Password_Program 类中的类似函数。 #includ
java - 当我导出 Java 程序时，为什么出现框架而不出现面板？
我想将我的游戏导出到 .jar 文件中。它导出；当我运行它时，框架出现了，但面板没有加载。我的框架和面板位于两个不同的类文件中，但我认为这没有什么区别。而且，它在 Eclipse 中完全可以工作。我在
java - 当我运行 Codenameone 程序时，按钮未显示在模拟器中
我粘贴了程序以从 codenameone 开发人员指南中创建一个按钮，并且我在 netbeans 中使用了该代码，但是当我单击“运行”时，它在模拟器中没有显示任何内容最佳答案您删除了 hi.sho
c - 当我运行 c 程序时，三个循环没有终止？
当我执行这个程序时，它并没有终止。例如，如果我给它输入 A，输出将是: 65 7 1000001 0 65 7 1000001 ... 我的代码: #include #include void
c - 当在循环中突然退出 C 程序时，为什么会发生额外的循环迭代？
考虑下面的基本客户端和服务器程序(只是骨架/说明我的问题)。客户端启动与服务器的连接，提示用户输入消息，然后发送到服务器并打印到屏幕。如果我在循环中间突然退出客户端程序(例如通过关闭终端窗口)，有时
java - 当我运行一个单线程 Java 程序时，为什么在操作系统级别有多个线程？
我运行一个非常简单的单线程 Java 程序。当我在 Ubuntu 下使用命令检查线程时 ps -eLf 它显示操作系统级别有 14 个线程。我希望当程序有一个线程时只有一个线程，如果程序有 x 个线程
scala - 当运行“.scala”程序时，Scala运行时/REPL背后到底发生了什么？
当我从命令行运行类似以下内容的代码时，真正发生了什么？ > scala hello.scala 是否有hello.class生成，执行然后丢弃？还是在这种情况下Scala表现得像翻译一样？我只是在想，
java - 运行此 Java 程序时 RAM 迅速增加
程序正在从网络摄像机接收以字节为单位的图像数据，然后处理图像。程序第一次启动时使用470Mb RAM，每1秒增加到15Mb，一直持续到没有足够的空间而计算机挂起。方法 getImage() 每 10
java - 当我运行 Selenium 程序时，它显示错误，如何解决这个问题？
当我运行我的 selenium 程序时，它显示错误，如何解决这个问题？ import org.openqa.selenium.By; public class sss { public sta
c++ - 运行 C++ 程序时 RAM 使用量没有变化
我写了一个简单的程序，试图查看内存中的变化，但没有任何变化。无论我是否运行代码，总是会出现大约 20% 左右的直线水平线。 #include using namespace std; int main
c++ - 在编写可移植的 c/c++ 程序时，使用外部文件的最佳方式是什么？
我是 c/c++ 领域的新手，我已经在虚拟机上沉迷太久了。我正在修改我们在整个公司使用的现有 C++ 工具。该工具正在所有主要操作系统(Windows、Mac、Ubuntu、Solaris 等)上使

首页

博学

6Ren·AI

商城

python - 当我运行该程序时，我不断收到此错误。我已经尝试了我能想到的一切，但仍然不起作用