ruby - 如何编写能够匹配一行或两行文本的正则表达式-6ren

ruby - 如何编写能够匹配一行或两行文本的正则表达式

转载作者：数据小太阳更新时间：2023-10-29 08:39:14

26

4

我试图匹配一些可以是一行或两行的文本。我希望能够有效地处理这两种情况。文本字符串将采用一致的格式并包含多个选项卡。我正在尝试用 ruby 进行比赛。正文如下:

单行:

#3  Hello Stormy    Scratched - Reason Unavailable                           11:10 AM ET

两行:

#3  Hello Stormy    Scratched - Reason Unavailable                            11:10 AM ET   
                    Scratch Reason - Reason Unavailable changed to Trainer     2:19 PM ET

我不得不在此处使用空格来格式化字符串，但实际文本使用制表符分隔各个部分:编号和名称、Scratched、原因和时间。

示例输出:

一行:#3 Hello Stormy Scratched - Reason Unavailable 11:10AM ET

两行#3 Hello Stormy Scratched - Reason Unavailable 更改为 Trainer 2:19PM

注意:理想情况下，两行输出将包括第一行中的数字和名称。

我能够构建一个匹配各个部分的表达式，但是制表符、第二行以及要求在两行输出中包含数字和马名的要求给我带来了麻烦。

最佳答案

你不需要花哨的正则表达式来做你想做的事，你只需要知道如何去做。

Ruby 的 Enumerable 有一个名为 slice_before 的方法它采用正则表达式，用于确定数组中的哪些元素组合在一起。 Array 继承自 Enumerable。例如:

text = '#3  Hello Stormy    Scratched   -   Reason Unavailable          11:10 AM ET
#3  Hello Stormy    Scratched   -   Reason Unavailable          11:10 AM ET
                        Scratch Reason  -   Reason Unavailable changed to Trainer   2:19 PM ET
'

data = text.split("\n").slice_before(/\A\S/).to_a

require 'pp'
pp data

输出:

[["#3\tHello Stormy\tScratched\t-\tReason Unavailable\t\t\t11:10 AM ET"],
["#3\tHello Stormy\tScratched\t-\tReason Unavailable\t\t\t11:10 AM ET",
  "\t\t\tScratch\tReason\t-\tReason Unavailable changed to Trainer\t2:19 PM ET"]]

换句话说，通过拆分 "\n" 上的文本创建的数组按不以空格开头的行分组，这是模式 /\A\S/。所有单行都在单独的子数组中。上一行的延续行与该行分组。

如果您正在从磁盘读取文件，您可以使用 IO.readlines 将文件作为数组读取，避免拆分文件的需要。

如果需要，您可以进一步处理该数组以重建行和续行，使用类似的东西:

data = text.split("\n").slice_before(/\A\S/).map{ |i| i.join("\n") }

将 data 变成:

["#3\tHello Stormy\tScratched\t-\tReason Unavailable\t\t\t11:10 AM ET",
"#3\tHello Stormy\tScratched\t-\tReason Unavailable\t\t\t11:10 AM ET\n\t\t\tScratch\tReason\t-\tReason Unavailable changed to Trainer\t2:19 PM ET"]

如果您需要将每一行拆分为其组成字段，请使用 split("\t")。如何跨子数组执行此操作留给您作为练习，但我会涉及 map。

编辑:

...I like your solution, but I'm getting undefined method for slice_before.

试试这个:

require 'pp'
require 'rubygems'

class Array

  unless Array.respond_to?(:slice_before)
    def slice_before(pat)
      result = []
      temp_result = []
      self.each do |i|

        if (temp_result.empty?)
          temp_result << i
          next
        end

        if i[pat]
          result << temp_result
          temp_result = []
        end

        temp_result << i
      end
      result << temp_result

    end
  end

end

这样调用:

ary = [
  '#3  Hello Stormy    Scratched - Reason Unavailable                           11:10 AM ET',
  '#3  Hello Stormy    Scratched - Reason Unavailable                            11:10 AM ET',
  '                    Scratch Reason - Reason Unavailable changed to Trainer     2:19 PM ET',
]

pp ary.slice_before(/\A\S/)

看起来像:

[
  ["#3  Hello Stormy    Scratched - Reason Unavailable                           11:10 AM ET"],
  ["#3  Hello Stormy    Scratched - Reason Unavailable                            11:10 AM ET",
   "                    Scratch Reason - Reason Unavailable changed to Trainer     2:19 PM ET"]
]

关于ruby - 如何编写能够匹配一行或两行文本的正则表达式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14947905/

26

4

0

文章推荐： ruby - Sinatra:指定使用多个应用程序时搜索路线的顺序？

文章推荐： ruby - 使用链接检查器( ruby )

文章推荐： ruby-on-rails - 安装 ruby gems 时无法创建 Makefile

文章推荐： ruby - 使用自定义退出代码的 rake 任务失败？

java - 能够 "tick"的时钟
我正在使用 Java 编写一个时钟程序，该程序能够“滴答作响”，但它存在问题。我认为它与 getter 和 setter 或 toString() 方法有关。计数器类 package clock;
javascript - React onwheel 不执行现有的scrollintoview 但 onclick 能够
const Index = () => { // Ref Links const frefLinks = { 1: useRef(1), 2: useRef(2), 3: useRef(3
python - 为什么 multiprocessing.Process 能够 pickle 修饰函数？
所以我读了here不能 pickle 装饰函数。确实: import multiprocessing as mp def deco(f): def wrapper(*args, **kwarg
go install 不创建包的二进制文件，而 go get 能够
我在go1.11.2 linux/amd64 版本。当包godog使用 go get github.com/DATA-DOG/godog/ 安装，godog 可执行文件在 $GOPATH/bin/中创
php - 在 Android 中编码字符串以便 PHP 能够 gzdecompress 它？
如何正确压缩字符串，以便 PHP 能够解压缩？我试过这个: public static byte[] compress(String string) throws IOException {
Z3 无法通过测试证明两个使用 Kleene 代数的简单程序之间的等价性，但 Mathematica 和 Reduce 能够
我们这里的问题是表明在测试中使用 Kleene 代数。在 b 的值由 p 保留的情况下，我们有交换条件 bp = pb;两个程序之间的等价性简化为等式在 b 的值不被 p 保留的情况下，我们有交
linux - openstack Quantum VM 能够 ping br-ex 但不能 ping 外部网络
我有一个与我的网络相关的非常奇怪的问题，我在具有多个接口(interface)的 VirtualBox 上安装了 RDO Grizzly OpenStack。虚拟盒子: eth0 - managem
javascript - Node.js 上的 TokenError : Bad Request; Google OAuth2; Passport. js；能够 console.log 数据，但是会出现错误
我正在尝试使用 Passport.js授权谷歌OAuth2在 Node.js .我整个星期都在尝试让它工作，但不知道为什么它不工作，所以现在我求助于 stack 寻求一些潜在的帮助。我已经尝试了所有在

首页

博学

6Ren·AI

商城

ruby - 如何编写能够匹配一行或两行文本的正则表达式