- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个包含 3972192 行的文件,每行都有两个值制表符。我想将每 47288 行分成一个新列(这派生于 84 列)。我阅读了这些其他问题 ( Put every N rows of input into a new column ),其中它与我想要的一样,但使用 awk 我得到:
awk: program limit exceeded: maximum number of fields size=32767
如果我用 pr 来做,要分隔的列的限制是 36。
为此,我首先使用 awk 选择了第 2 列:
awk '{print $2}' input_file>values_file
为了获得我所做的第一列值:
awk '{print $1}' input_file>headers_file
head -n 47288 headers_file >headers_file2
获得这两个文件后,我将使用粘贴功能将它们放在一起:
paste -d values_file headers_file2 >Desired_output
例子:输入:
-Line1: ABCD 12
-Line2: ASDF 3435
...
-Line47288: QWER 345466
-Line47289: ABCD 456
...
-Line94576: QWER 25
...
-Line3972192 QWER 436
期望的输出:
- Line1: ABCD 12 456 ....
...
- Line47288: QWER 345466 25 .... 436
有什么建议吗?提前致谢,
最佳答案
我想每个 block 都有相同的模式,我的意思是,第一列的顺序相同 [ABCD ASDF ... QWER] 并且再次出现。如果是这样,您必须获取第一个 BLOCK [47288 行] 的第一列并回显到目标文件。然后,您必须获取每个 BLOCK 的第二列并将其粘贴到目标文件中。我试过这个数据文件:
ABCD 1001EFGH 1002IJKL 1003MNOP 1004QRST 1005UVWX 1006ABCD 2001EFGH 2002IJKL 2003MNOP 2004QRST 2005UVWX 2006ABCD 3001EFGH 3002IJKL 3003MNOP 3004QRST 3005UVWX 3006ABCD 4001EFGH 4002IJKL 4003MNOP 4004QRST 4005UVWX 4006ABCD 5001EFGH 5002IJKL 5003MNOP 5004QRST 5005UVWX 5006
And with this script :
#!/bin/bash
#target number of lines, change to 47288
LINES=6
INPUT='data.txt'
TOTALLINES=`wc --lines $INPUT | cut --delimiter=" " --field=1`
TOTALBLOCKS=$((TOTALLINES / LINES))
#getting first block of target file, the first column of first LINES of data file
head -n $LINES $INPUT | cut --field=1 > target.txt
#get second column of each line, by blocks, and paste it into target file
BLOCK=1
while [ $BLOCK -le $TOTALBLOCKS ]
do
HEADVALUE=$((BLOCK * LINES))
head -n $HEADVALUE $INPUT | tail -n $LINES | cut --field=2 > tmpcol.txt
cp target.txt targettmp.txt
paste targettmp.txt tmpcol.txt > target.txt
BLOCK=$((BLOCK+1))
done
#removing temp files
rm -f targettmp.txt
rm -f tmpcol.txt
我得到了这个目标文件:
ABCD 1001 2001 3001 4001 5001EFGH 1002 2002 3002 4002 5002IJKL 1003 2003 3003 4003 5003MNOP 1004 2004 3004 4004 5004QRST 1005 2005 3005 4005 5005UVWX 1006 2006 3006 4006 5006
希望对你有帮助
关于linux - 将每 X 行输入放入一个新列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38202895/
问题故障解决记录 -- Java RMI Connection refused to host: x.x.x.x .... 在学习JavaRMI时,我遇到了以下情况 问题原因:可
我正在玩 Rank-N-type 并尝试输入 x x .但我发现这两个函数可以以相同的方式输入,这很不直观。 f :: (forall a b. a -> b) -> c f x = x x g ::
这个问题已经有答案了: How do you compare two version Strings in Java? (31 个回答) 已关闭 8 年前。 有谁知道如何在Java中比较两个版本字符串
这个问题已经有答案了: How do the post increment (i++) and pre increment (++i) operators work in Java? (14 个回答)
下面是带有 -n 和 -r 选项的 netstat 命令的输出,其中目标字段显示压缩地址 (127.1/16)。我想知道 netstat 命令是否有任何方法或选项可以显示整个目标 IP (127.1.
我知道要证明 : (¬ ∀ x, p x) → (∃ x, ¬ p x) 证明是: theorem : (¬ ∀ x, p x) → (∃ x, ¬ p x) := begin intro n
x * x 如何通过将其存储在“auto 变量”中来更改?我认为它应该仍然是相同的,并且我的测试表明类型、大小和值显然都是相同的。 但即使 x * x == (xx = x * x) 也是错误的。什么
假设,我们这样表达: someIQueryable.Where(x => x.SomeBoolProperty) someIQueryable.Where(x => !x.SomeBoolProper
我有一个字符串 1234X5678 我使用这个正则表达式来匹配模式 .X|..X|X. 我得到了 34X 问题是为什么我没有得到 4X 或 X5? 为什么正则表达式选择执行第二种模式? 最佳答案 这里
我的一个 friend 在面试时遇到了这个问题 找到使该函数返回真值的 x 值 function f(x) { return (x++ !== x) && (x++ === x); } 面试官
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: Isn't it easier to work with foo when it is represented b
我是 android 的新手,我一直在练习开发一个针对 2.2 版本的应用程序,我需要帮助了解如何将我的应用程序扩展到其他版本,即 1.x、2.3.x、3 .x 和 4.x.x,以及一些针对屏幕分辨率
为什么案例 1 给我们 :error: TypeError: x is undefined on line... //case 1 var x; x.push(x); console.log(x);
代码优先: # CASE 01 def test1(x): x += x print x l = [100] test1(l) print l CASE01 输出: [100, 100
我正在努力温习我的大计算。如果我有将所有项目移至 'i' 2 个空格右侧的函数,我有一个如下所示的公式: (n -1) + (n - 2) + (n - 3) ... (n - n) 第一次迭代我必须
给定 IP 字符串(如 x.x.x.x/x),我如何或将如何计算 IP 的范围最常见的情况可能是 198.162.1.1/24但可以是任何东西,因为法律允许的任何东西。 我要带198.162.1.1/
在我作为初学者努力编写干净的 Javascript 代码时,我最近阅读了 this article当我偶然发现这一段时,关于 JavaScript 中的命名空间: The code at the ve
我正在编写一个脚本,我希望避免污染 DOM 的其余部分,它将是一个用于收集一些基本访问者分析数据的第 3 方脚本。 我通常使用以下内容创建一个伪“命名空间”: var x = x || {}; 我正在
我尝试运行我的test_container_services.py套件,但遇到了以下问题: docker.errors.APIError:500服务器错误:内部服务器错误(“ b'{” message
是否存在这两个 if 语句会产生不同结果的情况? if(x as X != null) { // Do something } if(x is X) { // Do something } 编
我是一名优秀的程序员,十分优秀!