作者热门文章
- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我正在使用 Ruby 的 StringScanner 规范化一些英文文本。
def normalize text
s = ''
ss = StringScanner.new text
while ! ss.eos? do
s += ' ' if ss.scan(/\s+/) # mutiple whitespace => single space
s += 'mice' if ss.scan(/\bmouses\b/) # mouses => mice
s += '' if ss.scan(/\bthe\b/) # remove 'the'
s += "#$1 #$2" if ss.scan(/(\d)(\w+)/) # should split 3blind => 3 blind
end
s
end
normalize("3blind the mouses") #=> should return "3 blind mice"
相反,我只是得到 "mice"
。
StringScanner#scan
未捕获 (\d)
和 (\w+)
。
最佳答案
要访问捕获的 StringScanner(在 Ruby 1.9 及更高版本中),您可以使用 StringScanner#[]
:
s += "#{ss[1]} #{ss[2]}" if ss.scan(/(\d)(\w+)/) # splits 3blind => 3 blind
在 Ruby 2.1 中,您应该能够通过名称进行捕获(参见 Peter Alfvin 的 link )
s += "#{ss[:num]} #{ss[:word]}" if ss.scan(/(?<num>\d)(?<word>\w+)/)
关于ruby - 如何从 StringScanner 捕获项目?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19989493/
我是一名优秀的程序员,十分优秀!