gpt4 book ai didi

python - 在Python中搜索和分割带有特殊字符的字符串

转载 作者:太空宇宙 更新时间:2023-11-03 21:18:27 24 4
gpt4 key购买 nike

我正在刮Medmar website的时间表并想分割路线来自:

"Pozzuoli » Ischia"
"Pozzuoli - Procida"

"DEPARTURE PORT": 'Pozzuoli'
"ARRIVAL PORT": 'Ischia'
"DEPARTURE PORT": 'Pozzuoli'
"ARRIVAL PORT": 'Procida'

我尝试以两种不同的方式从列表中分割文本,具体取决于两个端口之间是否有“»”或“-”分隔符。首先,我搜索“»”或“-”并相应地划分字符串。由于某种原因,我在搜索时遇到重新错误

re.error: unterminated character set at position 0

代码:

def port_name_regex(port_name, index):
if re.search("[^\x00-\x7f",port_name):
port_name = departure_port = re.split("[^\x00-\x7f]",port_name,1)[index].capitalize
return port_name
else:
port_name = re.split("\w",port_name,1)[index].capitalize
return port_name

medmar_live_departures_table = list(soup.select('li.tratta'))
for li in medmar_live_departures_table:
next_li = li.find_next_sibling("li")
while next_li and next_li.get("data-toggle"):
if next_li.get("class") == ["corsa-yes"]:
medmar_live_departures_data.append({
'DEPARTURE PORT': port_name_regex(li.text, 0),
'ARRIVAL PORT': port_name_regex(li.text, -1),
'DEPARTURE TIME': next_li.strong.text,
'FERRY TYPE': "Traghetto",
'STATUS': "Active",
'OTHER INFO': "Next departure"
})
elif next_li.get("class") == ["corsa-no"]:
medmar_live_departures_data.append({
'DEPARTURE PORT': port_name_regex(li.text, 0),
'ARRIVAL PORT': port_name_regex(li.text, -1),
'DEPARTURE TIME' : next_li.strong.text,
'FERRY TYPE': "Traghetto",
'STATUS': "Cancelled"
})
next_li.find_next_sibling("li")
else:
medmar_live_departures_data.append({
'DEPARTURE PORT': port_name_regex(li.text, 0),
'ARRIVAL PORT': port_name_regex(li.text, -1),
'DEPARTURE TIME' : next_li.strong.text,
'FERRY TYPE': "Traghetto",
'STATUS': "Active"
})
next_li = next_li.find_next_sibling("li")

如何解决这个问题?

最佳答案

我遇到了同样的错误,我通过替换括号和圆括号解决了它,如下所示:

re.sub('\(|\)|\]|\[', '', word.lower())

错误提示(未终止的字符集) - 括号/括号位于开闭集中,表明缺少一个。检查您的数据中是否有这些字符。

关于python - 在Python中搜索和分割带有特殊字符的字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54505649/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com