gpt4 book ai didi

python - Pandas - 从行中提取文本

转载 作者:太空宇宙 更新时间:2023-11-04 09:40:14 25 4
gpt4 key购买 nike

假设我有一个如下所示的数据框:

df2 = pd.DataFrame(['Apple, 10/01/2016, 31/10/18, david/kate', 'orange', 'pear', 'Apple', '10/01/2016', '02/20/2017'], columns=['A'])

>>> df2

A file_name
0 Apple, 10/01/2016, 31/10/18, david/kate a.txt
1 orange a.txt
2 pear b.txt
3 Apple a.txt
4 10/01/2016 d.txt
5 02/20/2017 e.txt

我想要的是仅提取此数据框中的日期,因此输出将如下所示:

                        A        file_name
0 10/01/2016, 31/10/18 a.txt
1 Nothing to return a.txt
2 Nothing to return b.txt
3 Nothing to return a.txt
4 10/01/2016 d.txt
5 02/20/2017 e.txt

有没有人对如何做到这一点有任何建议?我不确定从哪里开始。

编辑#1:

我编辑了我的原始数据框和输出结果,以更好地反射(reflect)我正在寻找的内容。

最佳答案

与您想要的输出不完全匹配,但这种结构可能更好,并且可以轻松转换为您想要的。

基本上这是正则表达式的工作。此代码应找到任何形式为 number/number/number 的内容:

s = df2["A"]
result = s.str.extractall(r"(\d+/\d+/\d+)")[0]
print(result)

>>> match
0 0 10/01/2016
1 31/10/18
4 0 10/01/2016
5 0 02/20/2017

关于python - Pandas - 从行中提取文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52007489/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com