gpt4 book ai didi

linux - 如何在linux shell下获取每个创建表的第n个字段引用另一个文件?

转载 作者:塔克拉玛干 更新时间:2023-11-03 01:24:27 24 4
gpt4 key购买 nike

我有两个文本文件:file1.txt 和 file2.txt。file1.txt 是一个索引文件,例如file1.txt 的内容:

abc 1
def 2
ghi 3

其中“abc 1”表示表“abc”中的第一个字段。

file2.txt 实际上是许多表的创建表命令的转储,例如file2.txt 的内容:

create table "def".something 
(
f01 char(10),
f02 char(10),
f03 char(10),
f04 date
);
create table "abc".something
(
x01 char(10),
x02 char(1),
x03 char(10),
);
create table "ghi".something
(
z01 char(10),
z02 intr(10),
z03 double(10),
z04 char(10),
z05 char(10),
);

我想根据 file1.txt 中的每一行 'm n' 获取 file.txt 中表 m 的每个第 n 个字段的列表,方法是仅使用或组合使用 awk、grep、sed 或任何 Linux 下的文本处理命令壳。对于上面的例子,输出应该是:

abc,x01 char(10)
def,f02 char(10)
ghi,z03 double(10)

这可能吗?我该怎么做?

最佳答案

第一个解决方案 TXR :

此解决方案按定义文件中出现的顺序报告必填字段。这与按索引顺序排列的请求输出不同;这在第二个解决方案中涵盖。

另一项未涵盖的要求是索引可能具有同一数据库名称的多个条目,从而提取多个字段的可能性。第二种解决方案也涵盖了这一点。

运行:

$ txr reduce.txr index tbldefsdef,f02 char(10)abc,x01 char(10)ghi,z03 double(10)

Code in reduce.txr:

@(bind fnum @(hash :equal-based))
@(collect)
@table @field
@ (do (set [fnum table] (int-str field)))
@(end)
@(next)
@(collect)
create table "@name".something
(
@ (line start)
@ (skip)
@ (line @(+ start [fnum name] -1))
@line,
@(end)
@(output)
@ (repeat)
@name,@line
@ (end)
@(end)

这里获取字段号的技巧是使用 line 指令匹配数据库头之后的当前行号,将该行号捕获到 start变量:@(起始行)@(skip) 指令然后跳过零行或多行输入,直到后续 Material 匹配:并且该 Material 需要另一个 line 匹配,但这次是Lisp表达式(+ start [fnum name] -1):从1开始的字段的行号相对于之前在start中捕获的行号。

这种类型的 TXR 解决方案表达了对数据关键特征的匹配,而不是盲目地依赖固定的偏移量和最小的正则表达式。 TXR 将由于格式已更改而成为垃圾的数据成功输出的可能性降至最低。然而,与此同时,人们对 TXR 程序本身的数据是什么样子有了一些了解。很明显,@table @field 收集空格分隔的对,而那

create table "@name".something
(

匹配数据中的特定“图片”等等。

(顺便说一下,这个文字“某物”可能应该被一个变量代替!但是样本数据没有显示出这种差异。)

TXR中的第二种方案:

在这里,我们对索引做了一个小改动,从 abc 中选择两个字段:

$ cat indexabc 1def 2abc 2ghi 3

Now the results appear in the same order as in index, and both fields out of abc are reported:

$ txr reduce2.txr index tbldefsabc,x01 char(10)def,f02 char(10)abc,x02 char(1)ghi,z03 double(10)

The code is now:

@(do
(defvarl dblist)

(defvarl dbhash (hash :equal-based))

(defstruct dbfield nil
tblname fieldno defn
(:postinit (self)
(push self dblist)
(set [dbhash self] self))
(:method equal (self) (list self.tblname self.fieldno))))
@(repeat)
@tblname @field
@ (do (new dbfield
tblname tblname
fieldno (int-str field)))
@(end)
@(next)
@(repeat)
create table "@tblname".@suffix
(
@ (bind fieldno 0)
@ (repeat)
@defn,
@ (do (whenlet ((dbrec [dbhash (list tblname (inc fieldno))]))
(set dbrec.defn defn)))
@ (until)
);
@ (end)
@(end)
@(output)
@ (repeat :vars ((dbf (keep-if (usl defn) (reverse dblist)))))
@{dbf.tblname},@{dbf.defn}
@ (end)
@(end)

数据结构与一点OOP一起使用。当扫描第一个文件时,它使用 new 宏运算符将这些对转换为 dbfield 类型的结构对象。这些对象有一个表名和一个整数记录号。它们还有一个定义(defn 插槽),保留为默认值 nil。新创建时,它们的 :postinit 处理程序将它们添加到全局列表 dblist 中,并将每个添加到全局哈希 dbhash 中。 equal 方法确保为了实现 equal 相等性,记录被缩减为由表名和字段编号组成的双元素列表。这就是哈希表有效索引的内容。

当我们处理第二个文件时,我们使用数据库名称和运行计数器来查看 dbhash 中是否存在该键的 dbfield 结构。如果是这样,我们用提取的定义更新记录 defn

@(output) 部分,我们指示 repeat 遍历 dblist,但相反(因为第一个文件的条目被推到它上面,像一个堆栈)。我们还仅针对那些具有不是 nildefn 槽的条目过滤此列表。也就是说,索引文件可以引用不存在的数据库和字段。可以扩展要求以以某种方式报告这些或引发错误。

关于linux - 如何在linux shell下获取每个创建表的第n个字段引用另一个文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37585956/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com