gpt4 book ai didi

ruby - 懒洋洋地逐段阅读文件

转载 作者:数据小太阳 更新时间:2023-10-29 07:46:15 25 4
gpt4 key购买 nike

我将一些数据存储在一个文件中,其中每个感兴趣的 block 都存储在一个段落中,如下所示:

hello
there

kind

people
of

stack
overflow

我试过用下面的代码阅读每一段,但它不起作用:

paragraphs = File.open("hundreds_of_gigs").lazy.to_enum.grep(/.*\n\n/) do |p| 
puts p
end

我想用正则表达式说:“匹配任何以两个换行符结尾的东西”

我做错了什么?

解决此问题的任何懒惰方法表示赞赏。方法越简洁越好。

最佳答案

IO#readline("\n\n")会做你想做的。 FileIO 的子类,并且拥有它的所有方法,即使它们没有在 File ruby​​doc 页面上说明。

它逐行读取,行尾是给定的分隔符。

例如:

f = File.open("your_file")
f.readline("\n\n") => "hello\nthere\n\n"
f.readline("\n\n") => "kind\n\n"
f.readline("\n\n") => "people\nof\n\n"
f.readline("\n\n") => "stack\noverflow\n\n"

每次调用 readline lazy 从顶部开始读取文件的一行。

或者您可以使用 IO#each_line("\n\n")遍历文件。

例如:

File.open("your_file").each_line("\n\n") do |line|
puts line
end

=> "hello\nthere\n\n"
=> "kind\n\n"
=> "people\nof\n\n"
=> "stack\noverflow\n\n"

关于ruby - 懒洋洋地逐段阅读文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27420702/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com