gpt4 book ai didi

ruby-on-rails - 如何解析带有制表符分隔符的 TXT 文件中的数据?

转载 作者:太空宇宙 更新时间:2023-11-03 17:40:04 24 4
gpt4 key购买 nike

我正在使用 ruby​​ 1.8.7,rails 2.3.8。我想解析由制表符分隔的 TXT 转储文件中的数据。

在此 TXT 转储中包含一些 CSS 属性,看起来有一些无效数据。

enter image description here

当使用 FasterCSV gem 运行我的代码时

  FasterCSV.foreach(txt_file, :quote_char => '"',:col_sep =>'\t', :row_sep =>:auto, :headers => :first_row) do |row|
col= row.to_s.split(/\t/)
puts col[15]
end

在控制台中写为“第 38 行非法引用”的错误。任何人都可以建议我如何跳过包含无效数据的行并继续进行剩余行的数据加载过程吗?

最佳答案

这是一种方法。我们转到较低级别,使用 shift 解析每一行,然后静默 MalformedCSVError 异常,继续下一次迭代。这个问题是循环看起来不太好。如果有人可以改进这一点,欢迎您编辑代码。

FasterCSV.open(filename, :quote_char => '"', :col_sep => "\t", :headers => true) do |csv|
row = true
while row
begin
row = csv.shift
break unless row

# Do things with the row here...
rescue FasterCSV::MalformedCSVError
next
end
end
end

关于ruby-on-rails - 如何解析带有制表符分隔符的 TXT 文件中的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6543621/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com