gpt4 book ai didi

python - 返回一行中的单词列表但忽略某些空格

转载 作者:行者123 更新时间:2023-11-28 21:20:23 24 4
gpt4 key购买 nike

假设我有这条线:

235Carling             Robert         140 Simpson Ave     Toronto        Ont M6T9H1416/247-2538416/889-6178

你看到每个字符集合了吗?我希望那些代表数据文件中的列。我遇到的问题是“街道地址”列。

for i in master_file:
#returns a list of the words, splitting at whitespace
columns = i.split()

问题是这会将 140 Simpson Ave 分成三个“词”。如果单词被一定数量的空格或其他东西包围,我是否可以使用一种方法来单独说?

最佳答案

如果你有制表符,这很简单,但如果你只是在寻找不止一个空格的东西,你可以使用 python 的 re.split 方法来做到这一点:

import re

re.split('\s{2,}', '235Carling Robert 140 Simpson Ave Toronto Ont M6T9H1416/247-2538416/889-6178')

['235Carling', 'Robert', '140 Simpson Ave', 'Toronto', 'Ont M6T9H1416/247-2538416/889-6178']

其中 \s{2,} 只匹配任何 2 个或更多空白字符系列。

如果您的行之间的字符实际上有制表符,您可以完全避免使用正则表达式:

test = '235Carling             Robert         140 Simpson Ave     Toronto        Ont M6T9H1416/247-2538416/889-6178'

test.split('\t')

['235Carling', 'Robert', '140 Simpson Ave', 'Toronto', 'Ont M6T9H1416/247-2538416/889-6178']

关于python - 返回一行中的单词列表但忽略某些空格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22875004/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com