gpt4 book ai didi

python - 提取单词和分隔符之间的单词python

转载 作者:行者123 更新时间:2023-12-02 02:58:29 24 4
gpt4 key购买 nike

我从word文档(.doc)中提取了一些文本数据并将其存储在变量my_text中这样

my_text[2] = '2 Running Hrs                         -  \tPort M/E RPM  \t-  \t'

这里的\t是文档本身的分隔符。我正在尝试提取单词“Running Hrs”和“\t”分隔符之间的单词/字符。这样我就可以得到输出“-
这里我尝试过

  1. 试用 1

import re
re.search('Running Hrs(.*)\t', my_text[2].strip()).group(1)

输出

 '                         -  \tPort M/E RPM  '
  • 试用 2

  • print(re.findall(r'\Running Hrs([^]\t*)\]', str(my_text[2])))

    输出

    ERROR: error: bad escape \R

    对此有何建议。

    最佳答案

    您的第一次尝试非常接近您想要的,因为您只需要包含一个 ? 标志即可确保您的捕获组是非贪婪的,如下所示:

    r'Running Hrs(.*?)\t'

    如果没有这个 ? 标志,您的捕获组将被视为贪婪,并将尝试尽可能多地匹配,直到最后一个 \t,而非贪婪表达式只会捕获直到第一个 \t

    关于python - 提取单词和分隔符之间的单词python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60558776/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com