gpt4 book ai didi

python - 将行拆分为新行并从其他列添加相应的匹配值

转载 作者:太空宇宙 更新时间:2023-11-03 15:53:18 24 4
gpt4 key购买 nike

我有一个数据农场,如下所示

  data = pd.DataFrame({'Name': ['CTA15;CTA16;CAR;', 'AC007;AC008;GOO7;G008;F009', 'AC09;BC09;C09;V09;B0P', 'UF09;GF09;HF09;MN08'],  
'Sample':['JAK_1', 'TOR2', 'Gilo', 'ALR']})
data

Name Sample
0 CTA15;CTA16;CAR; JAK_1
1 AC007;AC008;GOO7;G008;F009 TOR2
2 AC09;BC09;C09;V09;B0P Gilo
3 UF09;GF09;HF09;MN08 ALR

我需要将 Name 列拆分成一个新行,并相应地在 Sample 列中添加值。最后,我的目标是拥有这样的数据框,

    Name    Sample
0 CTA15 JAK_1
1 CTA16 JAK_1
2 CAR JAK_1
3 AC007 TOR2
4 AC008 TOR2
5 GOO7 TOR2
6 G008 TOR2
7 F009 TOR2
8 AC09 Gilo
9 BC09 Gilo
10 C09 Gilo
11 V09 Gilo
12 B0P Gilo
13 UF09 ALR
14 GF09 ALR
15 HF09 ALR
16 MN08 ALR

我需要用';'分开到新行中,并将 Sample 列中的值相应地添加到每个。

最佳答案

您可以使用 str.strip用于删除 ; 在一些字符串的开头和结尾,str.split对于 list,然后得到 len对于它们的 length

最后通过 constructor 使用 numpy.repeat 创建新的 DataFramenumpy.concatenate :

vals = data['Name'].str.strip(';').str.split(';')
l = vals.str.len()
df = pd.DataFrame({'Sample':np.repeat(data['Sample'].values, l),
'Name':np.concatenate(vals.values)})
print (df)
Name Sample
0 CTA15 JAK_1
1 CTA16 JAK_1
2 CAR JAK_1
3 AC007 TOR2
4 AC008 TOR2
5 GOO7 TOR2
6 G008 TOR2
7 F009 TOR2
8 AC09 Gilo
9 BC09 Gilo
10 C09 Gilo
11 V09 Gilo
12 B0P Gilo
13 UF09 ALR
14 GF09 ALR
15 HF09 ALR
16 MN08 ALR

替代方案:

df = data.join(data.pop('Name')
.str.strip(';')
.str.split(';', expand=True)
.stack()
.reset_index(level=1, drop=True)
.rename('Name')).reset_index(drop=True)
print (df)
Sample Name
0 JAK_1 CTA15
1 JAK_1 CTA16
2 JAK_1 CAR
3 TOR2 AC007
4 TOR2 AC008
5 TOR2 GOO7
6 TOR2 G008
7 TOR2 F009
8 Gilo AC09
9 Gilo BC09
10 Gilo C09
11 Gilo V09
12 Gilo B0P
13 ALR UF09
14 ALR GF09
15 ALR HF09
16 ALR MN08

关于python - 将行拆分为新行并从其他列添加相应的匹配值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45214040/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com