pandas - 提取值(value)并从中创建新列-6ren

pandas - 提取值(value)并从中创建新列

转载作者：行者123 更新时间：2023-12-04 12:52:52

我想提取 URL 的特定部分，驻留在 Pandas Dataframe 的列中，并将其设为新列。这个

ref = df['REFERRERURL']
ref.str.findall("\\d\\d\\/(.*?)(;|\\?)",flags=re.IGNORECASE)

返回一个包含元组的系列。创建 Series 之前，如何只取出该元组的一部分，以便我可以简单地将其变成一列？ referrerurl 的样本数据是

http://wap.blah.com/xxx/id/11/someproduct_step2;jsessionid=....

在此示例中，我有兴趣创建一个仅包含“someproduct_step2”的列。

谢谢，

最佳答案

In [25]: df = DataFrame([['http://wap.blah.com/xxx/id/11/someproduct_step2;jsessionid=....']],columns=['A'])

In [26]: df['A'].str.findall("\\d\\d\\/(.*?)(;|\\?)",flags=re.IGNORECASE).apply(lambda x: Series(x[0][0],index=['first']))
Out[26]: 
               first
0  someproduct_step2

在 0.11.1 中，这也是一种巧妙的方法

In [34]: df.replace({ 'A' : "http:.+\d\d\/(.*?)(;|\\?).*$"}, { 'A' : r'\1'} ,regex=True)
Out[34]: 
                   A
0  someproduct_step2

关于pandas - 提取值(value)并从中创建新列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/16818871/

文章推荐： vim - 使用 xterm 在 .vimrc 中映射 Alt+umlaut 不起作用

文章推荐： Perl DBIx::Class DateTime 减法

文章推荐： sql - 时间戳 : db2 query 中的微秒

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

pandas - 提取值(value)并从中创建新列