- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我试图匹配一些可以是一行或两行的文本。我希望能够有效地处理这两种情况。文本字符串将采用一致的格式并包含多个选项卡。我正在尝试用 ruby 进行比赛。正文如下:
单行:
#3 Hello Stormy Scratched - Reason Unavailable 11:10 AM ET
两行:
#3 Hello Stormy Scratched - Reason Unavailable 11:10 AM ET
Scratch Reason - Reason Unavailable changed to Trainer 2:19 PM ET
我不得不在此处使用空格来格式化字符串,但实际文本使用制表符分隔各个部分:编号和名称、Scratched、原因和时间。
示例输出:
一行:#3 Hello Stormy Scratched - Reason Unavailable 11:10AM ET
两行#3 Hello Stormy Scratched - Reason Unavailable 更改为 Trainer 2:19PM
注意:理想情况下,两行输出将包括第一行中的数字和名称。
我能够构建一个匹配各个部分的表达式,但是制表符、第二行以及要求在两行输出中包含数字和马名的要求给我带来了麻烦。
最佳答案
你不需要花哨的正则表达式来做你想做的事,你只需要知道如何去做。
Ruby 的 Enumerable 有一个名为 slice_before
的方法它采用正则表达式,用于确定数组中的哪些元素组合在一起。 Array 继承自 Enumerable。例如:
text = '#3 Hello Stormy Scratched - Reason Unavailable 11:10 AM ET
#3 Hello Stormy Scratched - Reason Unavailable 11:10 AM ET
Scratch Reason - Reason Unavailable changed to Trainer 2:19 PM ET
'
data = text.split("\n").slice_before(/\A\S/).to_a
require 'pp'
pp data
输出:
[["#3\tHello Stormy\tScratched\t-\tReason Unavailable\t\t\t11:10 AM ET"],
["#3\tHello Stormy\tScratched\t-\tReason Unavailable\t\t\t11:10 AM ET",
"\t\t\tScratch\tReason\t-\tReason Unavailable changed to Trainer\t2:19 PM ET"]]
换句话说,通过拆分 "\n"
上的文本创建的数组按不以空格开头的行分组,这是模式 /\A\S/
。所有单行都在单独的子数组中。上一行的延续行与该行分组。
如果您正在从磁盘读取文件,您可以使用 IO.readlines
将文件作为数组读取,避免拆分文件的需要。
如果需要,您可以进一步处理该数组以重建行和续行,使用类似的东西:
data = text.split("\n").slice_before(/\A\S/).map{ |i| i.join("\n") }
将 data
变成:
["#3\tHello Stormy\tScratched\t-\tReason Unavailable\t\t\t11:10 AM ET",
"#3\tHello Stormy\tScratched\t-\tReason Unavailable\t\t\t11:10 AM ET\n\t\t\tScratch\tReason\t-\tReason Unavailable changed to Trainer\t2:19 PM ET"]
如果您需要将每一行拆分为其组成字段,请使用 split("\t")
。如何跨子数组执行此操作留给您作为练习,但我会涉及 map
。
编辑:
...I like your solution, but I'm getting undefined method for slice_before.
试试这个:
require 'pp'
require 'rubygems'
class Array
unless Array.respond_to?(:slice_before)
def slice_before(pat)
result = []
temp_result = []
self.each do |i|
if (temp_result.empty?)
temp_result << i
next
end
if i[pat]
result << temp_result
temp_result = []
end
temp_result << i
end
result << temp_result
end
end
end
这样调用:
ary = [
'#3 Hello Stormy Scratched - Reason Unavailable 11:10 AM ET',
'#3 Hello Stormy Scratched - Reason Unavailable 11:10 AM ET',
' Scratch Reason - Reason Unavailable changed to Trainer 2:19 PM ET',
]
pp ary.slice_before(/\A\S/)
看起来像:
[
["#3 Hello Stormy Scratched - Reason Unavailable 11:10 AM ET"],
["#3 Hello Stormy Scratched - Reason Unavailable 11:10 AM ET",
" Scratch Reason - Reason Unavailable changed to Trainer 2:19 PM ET"]
]
关于ruby - 如何编写能够匹配一行或两行文本的正则表达式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14947905/
我正在使用 Java 编写一个时钟程序,该程序能够“滴答作响”,但它存在问题。我认为它与 getter 和 setter 或 toString() 方法有关。 计数器类 package clock;
const Index = () => { // Ref Links const frefLinks = { 1: useRef(1), 2: useRef(2), 3: useRef(3
所以我读了here不能 pickle 装饰函数。确实: import multiprocessing as mp def deco(f): def wrapper(*args, **kwarg
我在go1.11.2 linux/amd64 版本。当包godog使用 go get github.com/DATA-DOG/godog/ 安装,godog 可执行文件在 $GOPATH/bin/中创
如何正确压缩字符串,以便 PHP 能够解压缩? 我试过这个: public static byte[] compress(String string) throws IOException {
我们这里的问题是表明 在测试中使用 Kleene 代数。 在 b 的值由 p 保留的情况下,我们有交换条件 bp = pb;两个程序之间的等价性简化为等式 在 b 的值不被 p 保留的情况下,我们有交
我有一个与我的网络相关的非常奇怪的问题,我在具有多个接口(interface)的 VirtualBox 上安装了 RDO Grizzly OpenStack。 虚拟盒子: eth0 - managem
我正在尝试使用 Passport.js授权谷歌OAuth2在 Node.js .我整个星期都在尝试让它工作,但不知道为什么它不工作,所以现在我求助于 stack 寻求一些潜在的帮助。我已经尝试了所有在
我是一名优秀的程序员,十分优秀!