gpt4 book ai didi

python - 使用正则表达式格式化字符串以删除非空格空白字符

转载 作者:行者123 更新时间:2023-12-01 07:43:09 25 4
gpt4 key购买 nike

我目前正在尝试从网站上获取一些信息,但遇到了一些问题。

我目前有一个 bs4.element.Tag 元素,其中包含一些 html 和文本,当我执行“variable.text”时,我得到以下文本:

\n\n乌尔姆斯特德俱乐部\n\t\t\t\t\t911 林奇博士\n\n\t\t\t\t\t\t阿诺德,马里兰州\t\t\t\t\t 21012\n\t\t\t\t\t美国\n(410) 757-9836\n\n 获取路线\n\n 最喜欢的球场\n\n\n\n网球场详细信息\n\n\n\n\n\n\n\t\t\t\t\t\t\t\t\t\t位置类型:\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t\t\t\n\n\t\t\t\t\t\t\t\t\t\t俱乐部\t\t\t\t\t\t\t\t\t\n\n\n\n\t\t\t\t\t\t\t\t\t\t此处进行的比赛:\t\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t\t\t\n\n\t\t\t\t\t\t\t\t\t\t0\t\t\t\t\t\t\t\t\t\n\n\n\n\t\t\t\t\t\t\t\t\t\t

我想要的是摆脱所有空白字符(\n\t)以获取列表或任何可迭代形式的相关信息。

我已经尝试了一堆正则表达式命令,但最接近我的目标的是:re.split('[\t\n]',variable.text) ,我得到以下信息:

['',
'',
'Ulmstead Club',
'',
'',
'',
'',
'',
'911 Lynch Dr',
'',
'',
'',
'',
'',
'',
'',
'Arnold, Maryland',
'',
'',
'',
'',

我切断了很多输出以节省一些空间。

我非常迷失,任何帮助将不胜感激

最佳答案

尝试拆分[\t\n]+:

re.split('[\t\n]+', variable.text.strip())

这似乎有效,因为它会消除输出数组中的空字符串条目。

关于python - 使用正则表达式格式化字符串以删除非空格空白字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56589725/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com