gpt4 book ai didi

python - 替换巨大的 txt 制表符分隔文件中第一行中的文本

转载 作者:太空宇宙 更新时间:2023-11-03 13:02:46 25 4
gpt4 key购买 nike

我有一个巨大的文本文件(大小为 19GB);它是一个带有变量和观察值的遗传数据文件。
第一行包含变量名,它们的结构如下:

id1.var1 id1.var2 id1.var3 id2.var1 id2.var2 id2.var3 

我需要交换 id1、id2 等。与另一个文本文件中的相应值(该文件有大约 7k 行)id 没有任何特定顺序,其结构如下:

oldId newIds
id1 rs004
id2 rs135

我已经进行了一些谷歌搜索,但无法真正找到允许执行以下操作的语言:

  1. 读第一行
  2. 用新的 ID 替换 ID
  3. 从原始文件中删除第一行并替换为新行

这是一个好的方法还是有更好的方法?
哪种语言是实现这一目标的最佳语言?
我们拥有 python、vbscipt 和 Perl 经验的人员。

最佳答案

只要替换行的长度与原始行的长度相同,几乎任何语言都可以进行整个“替换”操作(我对 Python 和 Perl 很确定),或者如果可以通过用空格填充使相同(否则,您将不得不重写整个文件)。

打开文件进行读写(w+模式),读取第一行,准备新行,seek到文件中的位置0,写入新的行,关闭文件。

关于python - 替换巨大的 txt 制表符分隔文件中第一行中的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14508860/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com