gpt4 book ai didi

dataframe - 将长度不匹配的列添加到 julia 中的数据帧

转载 作者:行者123 更新时间:2023-12-03 19:40:35 26 4
gpt4 key购买 nike

我正在尝试将长度(行数)不匹配的列添加到数据框中,它会引发错误,
DimensionMismatch("新列目标的长度为 60000 必须与数据框中的行数匹配 (47040000)")
我的代码片段是,

df = DataFrame(:Feature => train_x, :Target => train_y)

#train_x has 47040000 rows
#train_y has 60000 rows
请为这个问题提出一个解决方案。
先感谢您。

最佳答案

你确定这是你想要做的吗?通常人们会期望有很多行特征,因为目标列有很多行,所以这个错误可能指向你的代码中的概念问题。
但是,如果您绝对必须这样做,我会看到两种选择:

  • missing 填充较短的向量或您选择的某些值,所以 :Target => [train_y; [missing for _ in length(train_x) - length(train_y)] .在这里,我在向量的末尾填充,这可能适合也可能不适合您的情况
  • 执行 leftjoin与您的 train_x 的数据框列到数据框与您的 train_y column - 为此,您需要在两个 DataFrame 中都有一个 ibex 列来描述 y 的行如何与 x 匹配。如果你只是添加一个运行索引 1:length(train_*)对于两个数据帧,结果将与填充 train_y 的末尾相同与 missing
  • 关于dataframe - 将长度不匹配的列添加到 julia 中的数据帧,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65517270/

    26 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com