gpt4 book ai didi

python - 使用正则表达式创建 Pandas 列?

转载 作者:行者123 更新时间:2023-11-28 22:49:13 25 4
gpt4 key购买 nike

我有一个 pandas 字符串列。我想使用正则表达式将字符串的各个组成部分分解成它们自己的列:

In [35]:

import re
import pandas as pd

In [36]:

data = {'raw': ['Baker 1 2009-11-17 1223.0',
'Baker 1 2010-06-24 1122.7',
'Baker 2 2009-07-24 2819.0',
'Baker 2 2010-08-25 2971.6',
'Baker 1 2011-01-05 1410.0',
'Baker 2 2010-09-04 4671.6']}
df = pd.DataFrame(data, columns = ['raw'])
df

Out[36]:
raw
0 Baker 1 2009-11-17 1223.0
1 Baker 1 2010-06-24 1122.7
2 Baker 2 2009-07-24 2819.0
3 Baker 2 2010-08-25 2971.6
4 Baker 1 2011-01-05 1410.0
5 Baker 2 2010-09-04 4671.6

这是我想要的样子:

Out[41]:
name value date score
0 Baker 1 2010-06-24 1223.0
1 Baker 1 2009-07-24 1122.7
2 Baker 2 2009-07-24 2819.0
3 Baker 2 2010-08-25 2971.6
4 Baker 1 2011-01-05 1410.0
5 Baker 2 2010-09-04 4671.6

我试过 data.str.contains() 但我似乎无法让它工作。任何帮助将不胜感激。

最佳答案

基于这个答案 - Pandas DataFrame - how do I split a column

In [122]: pd.DataFrame(df['raw'].str.split().tolist(), columns=['name','value','date','score'])
Out[122]:
name value date score
0 Baker 1 2009-11-17 1223.0
1 Baker 1 2010-06-24 1122.7
2 Baker 2 2009-07-24 2819.0
3 Baker 2 2010-08-25 2971.6
4 Baker 1 2011-01-05 1410.0
5 Baker 2 2010-09-04 4671.6

[6 rows x 4 columns]

关于python - 使用正则表达式创建 Pandas 列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24098614/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com