gpt4 book ai didi

perl - 处理具有多种固定格式的文件的策略

转载 作者:行者123 更新时间:2023-12-04 13:44:37 27 4
gpt4 key购买 nike

这个问题不是Perl特有的(尽管 unpack 函数很可能会计入我的实现中)。

我必须处理存在多种格式的文件,以便按层次将数据分解为有意义的部分。我想做的就是将文件数据解析为合适的数据结构。

这是一个示例(关于RHS的评论):

                                       # | Format | Level | Comment
# +--------+-------+---------
**DEVICE 109523.69142 # 1 1 file-specific
.981 561A # 2 1
10/MAY/2010 24.15.30,13.45.03 # 3 2 group of records
05:03:01 AB23X 15.67 101325.72 # 4 3 part of single record
* 14 31.30474 13 0 # 5 3 part of single record
05:03:15 CR22X 16.72 101325.42 # 4 3 new record
* 14 29.16264 11 0 # 5 3
06:23:51 AW41X 15.67 101323.9 # 4 3
* 14 31.26493219 0 # 5 3
11/MAY/2010 24.07.13,13.44.63 # 3 2 group of new records
15:57:14 AB23X 15.67 101327.23 # 4 3 part of single record
* 14 31.30474 13 0 # 5 3 part of single record
15:59:59 CR22X 16.72 101331.88 # 4 3 new record
* 14 29.16264 11 0 # 5

我目前的逻辑是脆弱的:
  • 我知道,例如,格式2总是紧随格式1之后,并且它们仅跨越2行。
  • 我也知道格式4和5总是成对出现,因为它们对应于一条记录。记录数可以是
  • 变量
  • 我正在使用正则表达式来推断每行的格式。但是,这是有风险的,并且在将来(当有人决定更改输出的格式时)不会带来灵活性。

  • 这里最大的问题是我可以采用哪种策略来确定哪种格式需要用于哪一行。我很想知道其他人是否也遇到过类似的情况,以及他们为解决这个问题做了什么。

    最佳答案

    根据您要执行的操作,这可能是实际使用Parse::RecDescent编写正式语法的好地方。这将使您可以将整个文件提供给解析器,并从中获取数据结构。

    关于perl - 处理具有多种固定格式的文件的策略,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3638949/

    27 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com