- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
所以,我有一个如下所示的文件:
random stuff in the beginning...
<component>
<name>bob</name>
<age>7</age>
<country>Great_Britain</country>
</component>
<component>
<name>bob_secondbob</name>
<age>7</age>
<country>Great_Britain</country>
</component>
<component>
<name>bam</name>
<age>7</age>
<country>Great_Britain</country>
</component>
等等...
而且,我想将其作为 CSV 格式,如下所示:
name,age,country
bob,7,Great_Britain
bob_secondbob,7,Great_Britain
bam,7,Great_Britain
所以我想知道我该怎么做?
所以我当前的代码有像 bob
和 bam
这样的词,所以我一直像这样查找它并使用 sed 来获取值:
grep -A4 "<component>" $file | grep -A4 "<name>$bob.*</name>" | grep "<name>"
grep -A4 "<component>" $file | grep -A4 "<name>$bob.*</name>" | grep "<age>"
grep -A4 "<component>" $file | grep -A4 "<name>$bob.*</name>" | grep "<country>"
etc...
其中变量$bob
是“bob”
;
但问题是有 2 个 bob.*
实例,我不知道如何将它们分开,以便将它们打印出来......
我查看了 XML 模块,但该文件不是完全 XML,所以我无法使用它...
就像 bam
一样,通过 grep 可以很容易地打印出来,但是如果有多个 bob.*
实例,而我需要它们,我不知道如何正确打印出来,因为 grep 会返回多个结果。
关于我如何解决这个问题有什么建议吗?
最佳答案
明确指出“文件不是完全 XML”并且不能使用 XML 库。真糟糕:(
然后使用正则表达式对其进行解析。请记住,人们必须始终关注输入文件以查看其格式是否发生变化;即使是最小的更改也很容易使正则表达式失效,充其量会导致程序崩溃,或者更糟糕的是,会导致安静的错误。†
显示的格式很容易解析。这是一个基本的做法,解析类似 XML 的 component
任何标签及其值的部分,然后按所需顺序打印给定的一组实际标签。
use warnings;
use strict;
use feature 'say';
my $section_name = 'component'; # XML-like section to parse
my @tags = qw(name age country); # given tags and their order
my (%record, $in_XML);
while (<>) {
if (/^\s*<$section_name>\s*$/) { $in_XML = 1 }
elsif (/^\s*<\/$section_name>\s*$/) { $in_XML = 0 }
if ( $in_XML and m{<([^<]+)> ([^<]+) </\g{1}>}x ) {
push @{$record{$1}}, $2;
}
}
# Print out CSV-style output, with given tags
say join ',', @tags;
for my $i (0..$#{$record{$tags[0]}}) {
say join ',', map { $record{$_}->[$i] } @tags;
}
对标签做了一些假设。一些重要的:每个标签对都在一行上;所有标签名称都是唯一的。如果这些不包含需要调整的代码,可以做什么,但需要一些工作。
除了匹配类似 XML 的开始和结束标记对之外,<tagname>...</tagname>
,我还添加了一个标志,用于指示何时在 component
内进行处理部分。测试 if
内的标志条件允许在 XML 之外进行其他处理,否则我们可能会 next if not $in_XML;
之前if
健康)状况。如果文本中的其他地方不会出现意外的类似 XML 的标记对,那么这整个过程可能就没有必要了。
请注意,不必指定和使用 @tags
但可以打印文件中找到的标签,即 my @tags = keys %record
,如果这是可以接受的并且顺序无关紧要。
请添加测试来测试这些标签及其值是否确实符合预期。现实的输入文件往往偶尔会丢失或意外的部分。
† 如果可能的话,最好纠正“不是完全 XML”(使其成为 XML)并使用库。
关于xml - 在 Perl 中将类似 XML 的格式转换为 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64655663/
学习SQL。有一个简单的带有字段标题的桌面游戏。我想根据标题进行搜索。如果我有一款名为 Age of Empires III: Dynasties 的游戏,并且我使用 LIKE 和参数 Age of
我正在尝试为以下数据结构创建镜头。我正在使用lens-family . data Tree = Tree { _text :: String, _subtrees ::
我发现很难理解这一点。比如说,在 Python 中,如果我想要一个根据用户输入在循环中修改的列表,我会有这样的内容: def do_something(): x = [] while(
我有一个像这样的 mysql 查询 SELECT group_name FROM t_groups WHERE group_name LIKE '%PCB%'; 结果是 group_name ----
我的数据库表中有超过一百万条记录。当我使用like时非常慢,当我使用match against时他们丢失了一些记录。 我创建帮助表: 标签列表 tag_id tag_name tag_rel_me
我在我的一个 Java 项目中使用 JXBrowser 来简单显示 googlemaps 网页,以便我可以在那里跟踪路线,但最近我想改进该项目,但我的问题是 JXBrowser 的许可证过期(只有一个
小问题:如何将 mysql_escape_string 变量包含在 like 子句中? "SELECT * FROM table WHERE name LIKE '%". %s . "%'" 或
我尝试使用几个jquery消息插件,例如alertify . 但我注意到的主要事情是系统消息框会停止后台功能,直到用户响应。其他插件没有此功能。 有没有办法将此功能添加到 jquery 插件中?可以扩
我是 Ruby 新手。我过去使用过 shell。我正在将 shell 程序转换为 ruby。我有以下命令 cmd="cat -n " + infile + " | grep '127.0.0.1
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
当我研究 Rust 时,我试图编写一个 Rust 函数来查看任何可迭代的字符串。 我最初的尝试是 fn example_1(iter: impl Iterator); fn example_2(ite
我必须在我的项目中使用代码拆分。但无论如何,第一次初始下载有一些代码。 现在我想向最终用户展示代码下载(.cache.html - 或其他代码拆分)的进度,例如 gmail 启动进度。 请你帮帮我。
我今天找到了一个错误,它最终是由我代码中的以下片段引起的(我试图在列表中仅过滤“PRIMARY KEY”约束): (filter #(= (% :constraint_type "PRIMARY KE
我正在尝试在关键字段上实现检查约束。关键字段由 3 个字符的前缀组成,然后附加数字字符(可以手动提供,但默认是从序列中获取整数值,然后将其转换为 nvarchar)。关键字段定义为 nvarhcar(
我正在尝试使用以下方式创建 List 实例: List listOne = new ArrayList(); List listTwo = new ArrayList(){}; List listTh
我过去曾为 iOS 开发过,最近转向了 mac 开发。我开始了一个“感受”事物的项目,但遇到了一个问题。我试图创建一个 NSTableView 来显示多个项目,包括一个标签、一个 2 UIImageV
我正在尝试编写一个查询,该查询将返回哪些主机缺少某个软件: Host Software A Title1 A
AFAIK,在三种情况下别名是可以的 仅限定符或符号不同的类型可以互为别名。 struct 或 union 类型可以为包含在其中的类型设置别名。 将 T* 转换为 char* 是可以的。 (不允许相反
\s 似乎不适用于 sed 's/[\s]\+//' tempfile 当它为工作时 sed 's/[ ]\+//' tempfile 我正在尝试删除由于命令而出现在每行开头的空格: nl -s ')
我正在使用 ocamlgraph 在 ocaml 中编写程序,并想知道是否要将其移植到 F# 我有哪些选择?谢谢。 最佳答案 QuickGraph .Net 最完整的图形库之一 关于F# 图形库(类似
我是一名优秀的程序员,十分优秀!