gpt4 book ai didi

ruby - 如何在ruby中找到不是当前文件的文件路径

转载 作者:太空宇宙 更新时间:2023-11-03 17:29:27 25 4
gpt4 key购买 nike

我有一个装满文件的文件夹,有些是 txt 文件,有些是 rb 文件。我想做的是使用 main.rb 文件中的代码找到其中一个 txt 文件的路径。

我想一个便宜的技巧是使用 File.dirname(__FILE__) 这将获取当前 rb 文件的路径,因为 txt 文件位于它工作的同一文件夹中。但上帝禁止 txt 文件不在同一个文件夹中,有没有办法仍然找到该 txt 文件的路径?

最佳答案

一个简单的 Dir['c:/**/test.txt'] 将为您提供 c: 驱动器上所有 test.txt 文件的数组。

Dir['c:/**/*.txt'] 将为您提供所有扩展名为 .txt 的文件(可能很多)

但在 Windows 中有一个很棒的工具 search everything ,它还有一个命令行版本,您可以在 Ruby 脚本中捕获其输出。在大型文件夹或驱动器上,这将比也可以使用的“Dir”或“Find”快得多。我曾经这样做过,这里是执行此操作的方法,您将需要安装所有内容和命令行扩展。

require 'win32ole'
ES = 'C:\****\es\es.exe' # path to command line of Search Everything

def filelist path
command = %Q{"#{ES}" -n 60 folder: -p #{path.join(" ").gsub('/','\\')}}
list = []
IO.popen(command+" 2>&1") do |pipe|
while lijn = pipe.gets
list << lijn.chomp
end
end
list.join(',')
end

编辑

对于 Gary,一种向操作系统外包的方法,我在我的同步工具中使用它,它需要一个文件的最后修改时间,而使用 Ruby 方法获取它对于超过一千个文件来说太慢了.它返回一个散列,其中键是路径,值是文件的最后修改日期。它会跳过一些文件,如您所愿。

def list_files path
folder, collection = "", {}
IO.popen("dir /s /a:-d #{path}\\*.* 2>&1").each_line do |line|
case line
when /$RECYCLE.BIN|AlbumArt/ # skip these
when /\d{8}T\d{6}/ # skip these
when /desktop.ini|thumbs.db|sync_hist$/ # skip these
when /^(\d{2}\/\d{2}\/\d{4} \d{2}:\d{2})/
modified = $1
filename = line[36..-1].chomp
collection["#{folder}\\#{filename}".downcase] = DateTime::strptime(modified, "%d/%m/%Y %H:%M") rescue nil
when /^ Map van / # Dutch for Folder of (my OS is in Dutch)
folder = line[9..-1].chomp[path.length..-1]
end
end
collection
end

编辑2

今天我不得不使用其中一种方法,因为我必须处理的文件夹包含大约 30000 个文件,并且在正常 Ruby Dir 发生某些事情之前的等待时间太长,我的系统在脚本执行时卡住。

我记得这个答案,所以我想包括结果。

我做了一些基准测试,明显的赢家是来自 windows self 的 de dir。我最初发布的方法中存在一些错误和额外内容,但我不会更改它们,因为答案已被接受,额外内容(例如修改时间)可能会有用。

取而代之的是我用他们的基准测试的三种方法和第四种使用 lazy 来查看有什么变化(变化不大)。

require 'benchmark' 

STDOUT.sync = true
start_folder = 'c:/jpg'

def ruby_dir folder
ruby_folder = folder.gsub('\\','/')
files = []
Dir.glob("#{ruby_folder}/**/*").each do |file|
files << file if File.file? file
end
files
end

def ruby_dir_with_lazy folder
ruby_folder = folder.gsub('\\','/')
files = []
Dir.glob("#{ruby_folder}/**/*").lazy.each do |file|
if File.file? file
files << file
end
end
files
end

def os_dir path
win_path = path.gsub('/','\\')
files = []
folder = win_path
IO.popen("dir /s /a:-d #{win_path}\\*.* 2>&1").each_line do |line|
case line
when /^(\d{2}\/\d{2}\/\d{4} \d{2}:\d{2})/
filename = line[36..-1].chomp
files << "#{folder}\\#{filename}"
when /^ Map van / # Dutch for Folder of (my OS is in Dutch)
folder = line[9..-1].chomp
end
end
files
end

def es_dir path
win_path = path.gsub('/','\\')
files = []
es = 'c:\everything\es\es.exe' # path to command line of Search Everything
command = %Q{"#{es}" -p #{win_path}}
IO.popen(command+" 2>&1").each_line do |line|
files << line
end
files
end

Benchmark.bm do |x|
x.report("ruby_dir ") { 3.times { ruby_dir(path) } }
x.report("ruby_dir_with_lazy") { 3.times { ruby_dir_with_lazy(path) } }
x.report("os_dir ") { 3.times { os_dir(path) } }
x.report("es_dir ") { 3.times { es_dir(path) } }
end

os_dir 给出的结果是标准 Ruby Dir 的 26 倍

ruby_dir            1.747000  18.626000  20.373000 ( 20.397883)
ruby_dir_with_lazy 1.482000 18.799000 20.281000 ( 20.340853)
os_dir 0.608000 0.124000 0.732000 ( 0.786640)
es_dir 1.202000 1.202000 2.404000 ( 5.905093)

关于ruby - 如何在ruby中找到不是当前文件的文件路径,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49960037/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com