gpt4 book ai didi

Python 脚本使用一个文件中的坐标并添加另一文件中匹配坐标的值

转载 作者:太空宇宙 更新时间:2023-11-03 18:27:37 25 4
gpt4 key购买 nike

我在制表符分隔的床文件中有一组原始的基因组坐标(色度、开始、结束)。我还有其他制表符分隔的床文件,其中包含一些原始基因组坐标以及与每个坐标相关的数值。这些坐标可以在床文件中多次显示,每次都有不同的数值。我需要一个最终的床文件,其中包含每个原始基因组坐标以及与该特定坐标相关的所有值的总和。我正在使用的文件示例如下。

原始文件:

chr1    2100    2300

chr2 3300 3600

chr1 2560 2800

其他床文件:

chr1    2100    2300    6

chr2 3300 3600 56

chr1 2100 2300 10

所需的输出文件:

chr1    2100    2300    16

chr2 3300 3600 56

chr1 2560 2800 0

我需要编写一个 python 脚本来执行此操作,但我不太确定最好的方法是什么。

最佳答案

这是 Pandas 使事情变得非常简单的事情之一:

import pandas
coordnames = ['Name', 'x', 'y']
f1 = pandas.read_table('file1', delimiter=r' +',
names=coordnames).dropna()
f2 = pandas.read_table('file2', delimiter=r' +',
names=coordnames + ['n']).dropna()
result = (f1.merge(f2, on=coordnames, how='left')
.groupby(coordnames).sum().fillna(0))

关于Python 脚本使用一个文件中的坐标并添加另一文件中匹配坐标的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22899846/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com