- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我是一名 Perl 程序员,正在尝试通过学习我以前完成的一些工作并将其转换为 Python 来学习 Python。这不是逐行翻译。我想学习 Python 技术来完成此类任务。
我正在解析 Windows INI 文件。部分名称采用以下格式:
[<type> <description>]
<type>
是单个单词字段,不区分大小写。 <description>
可以是多个单词。
一段之后,有一堆参数和值。它们的形式是:
<parameter> = <value>
参数没有空格,只能包含下划线、字母和数字(不区分大小写)。因此,第一个 =
是参数和值之间的分频器。等号周围可能有空格分隔参数和值。行首或行尾可能有额外的空格。
在 Perl 中,我使用正则表达式进行解析:
while (my $line = <CONTROL_FILE>) {
chomp($line);
next if ($line =~ /^\s*[#;']/); #Comments start with "#", ";", or "'"
next if ($line =~ /^\s*$/); #Ignore blank lines
if ($line =~ /^\s*\[\s*(\w+)\s+(.*)/) { #Section
say "This is a '$1' section called '$2'";
}
elsif ($line =~ /^\s*(\w+)\s*=\s*(.*)/) { #Parameter
say "Parameter is '$1' with a value of '$2'";
}
else { #Not Comment, Section, or Parameter
say "Invalid line";
}
}
问题是我已经被 Perl 破坏了,所以我认为最简单的方法是使用正则表达式。这是我到目前为止的代码...
for line in file_handle:
line = line.strip
# Comment lines and blank lines
if line.find("#") == 1 \
or line.find(";") == 1 \
or line.whitespace:
continue
# Found a Section Heading
if line.find("[") == 1:
print "I want to use a regular expression here"
print "to split the section up into two pieces"
elif line.find("=") != -1:
print "I want to use a regular expression here"
print "to split the parameter into key and value"
else
print "Invalid Line"
这里有几件事让我恼火:
我一直在浏览各种在线教程,它们帮助我理解了语法,但在处理语言本身方面帮助不大——尤其是那些倾向于用另一种语言思考的人。
我的问题:
最佳答案
虽然我认为这不是您的意图,但文件格式看起来与 Python 的内置 ConfigParser 非常相似。模块。有时已经为您提供了最“Pythonic”的方式。 (:
更直接地回答您的问题:正则表达式可能是执行此操作的好方法。否则,您可以尝试更基本的(和不太健壮的)
(parameter, value) = line.split('=')
如果该行不包含或包含多个“=”字符,这将引发错误。您可能想先使用 '=' in line
对其进行测试。
还有:
line.find("[") == 1
可能更好地替换为
line.startswith("[")
希望对您有所帮助(:
关于python - Python 中的解析行 : Use RE or Not?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9201723/
根据文档,“|”可用于创建匹配任一由“|”分隔的模式的正则表达式。 我正在尝试使用以下内容来查看 moves 是否包含与“UP”“DOWN”“LEFT”“RIGHT”之一匹配的字符串: moves =
这个问题在这里已经有了答案: What is the difference between re.search and re.match? (8 个回答) 1年前关闭。 来自 regex docs它说
谁能告诉我是否可以组合像 re.IGNORECASE 这样的标志, re.MULTILINE和 re.DOTALL正则表达式匹配? r = re.compile(regex, re.IGNORECAS
这个问题在这里已经有了答案: Python re.sub with a flag does not replace all occurrences (3 个答案) 关闭 6 年前。 为什么这符合预期
提前致谢。我的问题是: 我有一段 Python 代码,我在其中尝试使用“os.walk,re and re.findall ip”来尝试在多个文件中查找所有 ip 地址,例如: file1:192.1
在演示 Python 的正则表达式功能时,我编写了一个小程序来比较 re.search()、re.findall() 和 re 的返回值.finditer()。我知道 re.search() 每行只会
我有一台运行 Lion 和 Python 2.7.1 的 Mac。我注意到 re 模块中有一些非常奇怪的东西。如果我运行以下行: print re.split(r'\s*,\s*', 'a, b,\n
在 python 中,re.search() 检查字符串中任何位置的匹配项(这是 Perl 默认执行的操作)。 那么,为什么我们不像在 Ex(2) 中那样在 Ex(1) 中得到 'ABBbbb' 的输
我正在尝试从存储在光盘上的 HTML 文档中创建单词列表。当我尝试拆分单词并将它们添加到我的单词向量中时,我最终陷入了困惑。 def get_word_vector(self): line =
所以我尝试只打印月份,当我使用时: regex = r'([a-z]+) \d+' re.findall(regex, 'june 15') 它打印:六月但是当我尝试对这样的列表执行相同操作时: re
我正在学习 Python 的正则表达式。下面有两个略有不同的 re.search() 函数。唯一的区别是我在'}'之前添加了一个空格。任何人都可以解释导致结果差异的原因吗?谢谢! 我的代码: impo
我被难住了。我正在编写 Python 3.6.2,使用 PyCharm 作为我的 IDE。以下脚本片段说明了我的问题: def dosubst(m): return m.group() + "
这个问题在这里已经有了答案: Python re.search (2 个答案) 关闭 9 年前。 我正在尝试从 Hackerrank 的问题中解决这个问题。这是一个机器学习问题。最初,我试图从语料库
请解释一下为什么使用 re.find 和 re.sub 会得到不同的结果 我解析的字符串: GRANT USAGE ON *.* TO 'testuser'@'10.10.10.10' IDENTIF
为什么re.match返回的是None对象,而类似的re.findall返回的是非空结果? 我正在解析电子邮件主题。有问题的是 subject = "=?UTF-8?B?0JLQsNGI0LUg0YH
问题第 1 部分 我得到了这个文件 f1: George Washington Joe Taylor 我想重新编译它,它看起来像这样 f1:(带空格) George Washington Joe
python正则表达式模块简介 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。Python 1.5之前版本则是通过 regex 模块提供 Emacs 风格的
我的字符串看起来像“Billboard Bill SpA”。我想要一个删除 SpA 的正则表达式,但前提是它前面有一个大写单词。我使用的正则表达式是“[A-Z][a-z]*\s(SpA)”。如果我使用
我有一个 str,我想获取单引号内的子字符串 ('): line = "This is a 'car' which has a 'person' in it!" 所以我用了: name = re.fi
这个问题在这里已经有了答案: Difference between regular expression modifiers (or flags) 'm' and 's'? (3 个答案) Pyth
我是一名优秀的程序员,十分优秀!