gpt4 book ai didi

python - 在 Python 正则表达式中使用 ^ 匹配行首

转载 作者:行者123 更新时间:2023-12-03 03:23:51 34 4
gpt4 key购买 nike

我正在尝试从 Thomson-Reuters Web of Science 中提取出版年份 ISI 风格的数据。 “出版年份”的行看起来像这样(在行的最开头):

PY 2015

对于我正在编写的脚本,我定义了以下正则表达式函数:

import re
f = open('savedrecs.txt')
wosrecords = f.read()

def findyears():
result = re.findall(r'PY (\d\d\d\d)', wosrecords)
print result

findyears()

然而,这会给出假阳性结果,因为该模式可能出现在数据的其他位置。

所以,我只想匹配行开头的模式。通常我会使用 ^ 来达到此目的,但是 r'^PY (\d\d\d\d)' 无法匹配我的结果。另一方面,使用 \n 似乎可以满足我的要求,但这可能会给我带来进一步的复杂性。

最佳答案

re.findall(r'^PY (\d\d\d\d)', wosrecords, flags=re.MULTILINE)

应该可以

关于python - 在 Python 正则表达式中使用 ^ 匹配行首,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31400362/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com