gpt4 book ai didi

python - 根据 Pandas 中的关键字对列进行分区

转载 作者:太空宇宙 更新时间:2023-11-03 14:43:45 24 4
gpt4 key购买 nike

我有一个 excel 文件,我已将其作为数据帧读入 python,如图所示。

   Store       List
Ralphs bag1
apple
pear
Ralphs bag2
toilet paper
Albertsons bag3
magazines
paper

我正在尝试将第二列扩展为两列,如图所示。

   Bag       Item
bag1 Apple
bag1 Pear
bag2 Toilet Paper
bag3 Magazines
bag3 paper

每当原始表中列出一个项目时,商店列就有 Na。是否有一些 pandas 函数具有基于 Na 的单独函数?或者用所有包包创建一个系列并将其用作切入点会更容易吗?

最佳答案

设置

df
Store List
0 Ralphs bag1
1 Ralphs apple
2 Ralphs pear
3 Ralphs bag2
4 Ralphs toilet paper
5 Albertsons bag3
6 Albertsons magazines
7 Albertsons paper
<小时/>

您可以将 df.wherestr.contains 结合使用,提取以 bag 开头的所有行,然后过滤掉虚假行。

df = df.assign(Bag=df.List.\
where(df.List.str.contains('bag')).ffill()).drop('Store', 1)
df[df.List != df.Bag]

List Bag
1 apple bag1
2 pear bag1
4 toilet paper bag2
6 magazines bag3
7 paper bag3

关于python - 根据 Pandas 中的关键字对列进行分区,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46413379/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com