gpt4 book ai didi

python - 拆分 pandas 数据框中字符串中的第 n 个元素

转载 作者:行者123 更新时间:2023-12-01 23:01:25 25 4
gpt4 key购买 nike

目前我在 pandas 数据框中有列。 df看起来像这样:

<表类="s-表"><头>read_name<正文>NB511043:297:HJJMHBGXJ:1:22110:22730:3876NB511043:297:HJJMHBGXJ:4:22609:8139:4265NB511043:298:HT6KCBGXJ:1:13311:16766:2025

我希望做的是专门提取此 df 中每个字符串的第 5 个和第 7 个元素,并将它们附加到同一数据帧的末尾,如下所示:

<表类="s-表"><头>值第五个元素第七个元素<正文>NB511043:297:HJJMHBGXJ:1:22110:22730:3876221103876NB511043:297:HJJMHBGXJ:4:22609:8139:4265226094265NB511043:298:HT6KCBGXJ:1:13311:16766:2025133112025

我目前的方法是使用 str.split 创建一个全新的数据框拆分 read_name 中的所有内容,然后简单地将这些值附加到新数据框。像这样

df_read_name= df['read_name'].str.split(":", n = 6, expand = True)
df['5th element']= pd.to_numeric(df_read_name[4])
df['7th element']= pd.to_numeric(df_read_name[6])

但是,我认为这有点麻烦,希望有更快的方法。

一如既往,我们将不胜感激!

最佳答案

你可以在这里使用str.extract:

df[["5th element", "7th element"]] = df["value"].str.extract(r'(?:[^:]+:){4}([^:]+):[^:]+:([^:]+).*')

关于python - 拆分 pandas 数据框中字符串中的第 n 个元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71764317/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com