python - Python 中的 Pandas 错误 : columns must be same length as key-6ren

python - Python 中的 Pandas 错误 : columns must be same length as key

转载作者：行者123 更新时间：2023-12-01 22:28:42

27

4

我正在从几个网站上抓取一些数据，并使用 Pandas 对其进行修改。

在前几个数据块上它运行良好，但后来我收到此错误消息:

Traceback(most recent call last):
  File "data.py", line 394 in <module> df2[['STATUS_ID_1','STATUS_ID_2']] = df2['STATUS'].str.split(n=1, expand=True)
  File "/home/web/.local/lib/python2.7/site-packages/pandas/core/frame.py, line 2326, in __setitem__ self._setitem_array(key,value)
  File "/home/web/.local/lib/python2.7/site-packages/pandas/core/frame.py, line 2350, in _setitem_array
raise ValueError("Columns must be same length as key')  ValueError: Columns must be same length as key

我的代码在这里:

df2 = pd.DataFrame(datatable,columns = cols)
df2['FLIGHT_ID_1'] = df2['FLIGHT'].str[:3]
df2['FLIGHT_ID_2'] = df2['FLIGHT'].str[3:].str.zfill(4)
df2[['STATUS_ID_1','STATUS_ID_2']] = df2['STATUS'].str.split(n=1, expand=True)

EDIT-jezrael :我使用了您的代码，并从中打印了:
我希望通过这个我们可以找到问题出在哪里..因为当脚本遇到这种拆分问题时，它似乎是随机的..

                 0         1
2       Landed   8:33 AM
3       Landed   9:37 AM
4       Landed   9:10 AM
5       Landed   9:57 AM
6       Landed   9:36 AM
8       Landed   8:51 AM
9       Landed   9:18 AM
11      Landed   8:53 AM
12      Landed   7:59 AM
13      Landed   7:52 AM
14      Landed   8:56 AM
15      Landed   8:09 AM
18      Landed   8:42 AM
19      Landed   9:39 AM
20      Landed   9:45 AM
21      Landed   7:44 AM
23      Landed   8:36 AM
27      Landed   9:53 AM
29      Landed   9:26 AM
30      Landed   8:23 AM
35      Landed   9:59 AM
36      Landed   8:38 AM
37      Landed   9:38 AM
38      Landed   9:37 AM
40      Landed   9:27 AM
43      Landed   9:14 AM
44      Landed   9:22 AM
45      Landed   8:18 AM
46      Landed  10:01 AM
47      Landed  10:21 AM
..         ...       ...
316    Delayed   5:00 PM
317    Delayed   4:34 PM
319  Estimated   2:58 PM
320  Estimated   3:02 PM
321    Delayed   4:47 PM
323  Estimated   3:08 PM
325    Delayed   3:52 PM
326  Estimated   3:09 PM
327  Estimated   2:37 PM
328  Estimated   3:17 PM
329  Estimated   3:20 PM
330  Estimated   2:39 PM
331    Delayed   4:04 PM
332    Delayed   4:36 PM
337  Estimated   3:47 PM
339  Estimated   3:37 PM
341    Delayed   4:32 PM
345  Estimated   3:34 PM
349  Estimated   3:24 PM
356    Delayed   4:56 PM
358  Estimated   3:45 PM
367  Estimated   4:09 PM
370  Estimated   4:04 PM
371  Estimated   4:11 PM
373    Delayed   5:21 PM
382  Estimated   3:56 PM
384    Delayed   4:28 PM
389    Delayed   4:41 PM
393  Estimated   4:02 PM
397    Delayed   5:23 PM

[240 rows x 2 columns]

最佳答案

您需要一些修改解决方案，因为有时它返回 2，有时只返回一列:

df2 = pd.DataFrame({'STATUS':['Estimated 3:17 PM','Delayed 3:00 PM']})


df3 = df2['STATUS'].str.split(n=1, expand=True)
df3.columns = ['STATUS_ID{}'.format(x+1) for x in df3.columns]
print (df3)
  STATUS_ID1 STATUS_ID2
0  Estimated    3:17 PM
1    Delayed    3:00 PM

df2 = df2.join(df3)
print (df2)
              STATUS STATUS_ID1 STATUS_ID2
0  Estimated 3:17 PM  Estimated    3:17 PM
1    Delayed 3:00 PM    Delayed    3:00 PM

另一种可能的数据 - 所有数据都没有空格，解决方案也有效:

df2 = pd.DataFrame({'STATUS':['Canceled','Canceled']})

和解决方案返回:

print (df2)
     STATUS STATUS_ID1
0  Canceled   Canceled
1  Canceled   Canceled

全部一起:

df3 = df2['STATUS'].str.split(n=1, expand=True)
df3.columns = ['STATUS_ID{}'.format(x+1) for x in df3.columns]
df2 = df2.join(df3)

关于python - Python 中的 Pandas 错误 : columns must be same length as key，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46585193/

27

4

0

文章推荐： r - 一个好的R包名称是什么？

文章推荐： signalr - 如何仅向 SignalR 中的调用方客户端发送消息？

文章推荐： android - 通过蓝牙接收消息到 raspberrypi

文章推荐： go - 如何在DynamoDB UpdateItem中更新数组对象

Column headers not rendering as expected after refactoring (重构后列标题未按预期呈现)
这正确地呈现了标题，因为我可以看到一个列带有“Product ID”标题的表：。我正试图重构它，这样我就可以重用它，因为它们在整个应用程序中几乎是相同的：。在这种情况下，头不会呈现...检查页面元素中
python - 避免在执行 df ['column' ] = df ['column' ] 时写两次 df ['column' ]
我什至不知道如何表达这一点，但在 Python 中有没有一种方法可以引用等号之前的文本，而无需实际再次编写？ ** 编辑 - 我在 Jupyter 中使用 python3 我似乎用了半辈子的时间来写作
python : group by columns with columns values that are grouped by occurs only once and retain all other columns
假设我有一个包含以下列的字典 dict_ = [ {'key1': 'value1', 'key2': 'value2', 'key3': 'value3', '
python : group by columns with columns values that are grouped by occurs only once and retain all other columns
假设我有一个包含以下列的字典 dict_ = [ {'key1': 'value1', 'key2': 'value2', 'key3': 'value3', '
MySql 当 table.column = table.column 时选择 table.column
假设我的数据库中有一张地铁 map ，其中每条线路的每个站点都是一行。如果我想知道我的线路在哪里互连: mysql> SELECT LineA.stop_id FROM LineA, LineB WH
hadoop - hive QL : split column into 2 columns and rank each column
代码 select c1,c2,c3,c4,c5,c6 from table where c5 in ('a', 'b') 从这里开始，我想将 c5 列拆分为两列，然后根据它们对 c
MySQL : search two columns : one column first then second column
我正在尝试搜索表格中的两列，即标题和描述。但我想先搜索标题，然后再搜索描述。所以匹配标题的所有行排在第一位，所有匹配描述的行排在第二位我可以使用单个 SQL 查询来实现吗？最佳答案您还可以使用
Python数据框: Create New Column Based on Values in a String Column and a Float Column
下面有以下 Python 数据框。 “标志”字段是我想要用代码创建的所需列。我想要执行以下操作: 如果“分配类型”是预测的并且“Activities_Counter”大于 10，我想创建一个名为“F
mysql - 为什么 `WHERE column` 给出的结果与 `WHERE column IS NOT NULL AND column <> ' '` 不同？
我有两列，area 和 block，其中 area 是一个 int 类型，block 是一个 varchar。现在我正在写两个查询: select * from table where area a
mysql - Slick 2 将 (Column[A], Column[B]) 转换为 Column[(A,B)]
使用 Slick 2，我试图生成一个带有元组 IN 子句的查询: select * from my_table where (a, b) IN ((1, 87)); 给定: val seq: Seq[
php - Mysql Where Column A = X and Column B = Y and or Column B = Z
我正在尝试从数据透视表中获取一组值，其中 A 列等于值数组，例如 ID 12 的 attribute_value_id 等于 3 和 9。这可以做到吗？我已经走了这么远... ID | post_id
Python-数据帧 : Multiply multiple columns by another column and save in new columns
我找不到这样做的有效方法。我在 Python 中有以下 DataFrame，列从 A 到 Z A B C ... Z 0 2.0 8.0 1.0 ... 5.0 1
python Pandas : Merge Columns of Data Frame with column name into one column
我的数据框中有以下格式的数据: >>> df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD')) >>> df
mysql - 如果 'table a' .'column b' 匹配 'table b' .'column b'，如何将 'table a' .'column b' 替换为 'table b' .'column a'
我有多个与我公司销售的产品相关的表被新产品取代，随着时间的推移，这导致了多个表的出现。我一遍又一遍地使用以下查询，直到最终表中只剩下 2 个产品... CREATE TABLE mar15a
mysql - 如何用 'table a' .'column b' 替换 'table b' .'column b' 如果 'table a' .'column a' 匹配 'table b' .'column a'
我有如下 2 个表:- 表A ------------------------------- | product_id | price | --------------------
mysql - 一个表中的 COLUMN NAME 和 COLUMN COMMENT 以及另一个表中的 COLUMN VALUE。如何？
我有一个名为 tbl_mainsheet7 的表，创建方式如下: pk_mainsheet client_id project_id mainsheet_id project_cat EA_
html - CSS 问题 : Fixed column + Auto column with a nested Auto column inside
我得到了以下 HTML 结构: ... ... 我的 CSS: #main-container { width:80%; margin:20px auto;
r - R : Replace a column value with a value from same column after matching two other columns values 中的数据表
对于我的以下要求，我无法获得解决方案。如果 data.table(如下)在 Col1 和 Col3 中有匹配的值。替换 Col2 值(旧的 New-Val)。 Col1 Col2 Col3
c# - SQL : Select Distinct rows by all columns but omit one column (say ID column)
我正在通过连接几个表来构建一个 View ，以通过 Entity Framework 提取数据。由于此 View 没有唯一列，EntityFramework 无法检索正确的结果集(即第一列重复)。为
python - Pandas 中的数据操作 : create a boolean column from values on column then fill with value from yet another column
好的，我已经尝试了太久了，是时候寻求帮助了。我有一个看起来有点像这样的数据框: person fruit quantity all_fruits 0 p1 grapes 2

首页

博学

6Ren·AI

商城

python - Python 中的 Pandas 错误 : columns must be same length as key