python - Pandas 用正则表达式将列表分成几列-6ren

python - Pandas 用正则表达式将列表分成几列

转载作者：太空狗更新时间：2023-10-29 22:04:38

我有一个字符串列表:

content
01/09/15, 10:07 - message1
01/09/15, 10:32 - message2
01/09/15, 10:44 - message3

我想要一个数据框，例如:

     date                message
01/09/15, 10:07          message1
01/09/15, 10:32          message2
01/09/15, 10:44          message3

考虑到我在列表中的所有字符串都以这种格式开头，我可以按 - 拆分，但我宁愿寻找一种更聪明的方法来做到这一点。

history = pd.DataFrame([line.split(" - ", 1) for line in content], columns=['date', 'message'])

(之后我会将日期转换为日期时间)

如有任何帮助，我们将不胜感激。

最佳答案

您可以使用 str.extract - 命名组可以成为列名

In [5827]: df['content'].str.extract('(?P<date>[\s\S]+) - (?P<message>[\s\S]+)', 
                                     expand=True)
Out[5827]:
              date   message
0  01/09/15, 10:07  message1
1  01/09/15, 10:32  message2
2  01/09/15, 10:44  message3

详细信息

In [5828]: df
Out[5828]:
                      content
0  01/09/15, 10:07 - message1
1  01/09/15, 10:32 - message2
2  01/09/15, 10:44 - message3

关于python - Pandas 用正则表达式将列表分成几列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46928636/

文章推荐： python - 导入 GoogleNews-vectors-negative300.bin

文章推荐： c# - 我如何教计算机系统玩扑克牌？

文章推荐： c# - 比较两个日期时间 - 没有小时和秒

文章推荐： python - 在 Python 中递归镜像嵌套元组

c# - Datatable to dictionary 几列
我正在尝试使用描述的方法将数据表转换为字典 here , 但我得到一个错误 Cannot implicitly convert type System.Collections.Generic.Dict
sql - orderBy 几列 - Doctrine QueryBuilder
我想在几个列上使用 orderBY，但它们应该像一列一样。该表看起来像这样: col1 | col2 5 | 2 | | 3 7 | | 1 | 1
MySQL SELECT id of row where GREATEST of MAX entries of 几列
我有这张表 mytable: +----+--------------------------------------+ | id | date1 | date2 | date3

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - Pandas 用正则表达式将列表分成几列