python - 验证前一行是否具有与当前行相同的字符串和另一列的总和值-6ren

python - 验证前一行是否具有与当前行相同的字符串和另一列的总和值

转载作者：太空宇宙更新时间：2023-11-04 05:47:39

25

4

我想做的是这样的脚本读取当前文件:

chr1,700244,714068,LOC100288069,982
chr1,1568158,1570027,MMP23A,784
chr1,1567559,1570030,MMP23A,784
chr1,1849028,1850740,TMEM52,799
chr1,2281852,2284100,LOC100129534,934
chr1,2281852,2284100,LOC100129534,800
chr1,2460183,2461684,HES5,819
chr1,2460183,2461684,HES5,850
chr1,2517898,2522908,FAM213B,834
chr1,2518188,2522908,FAM213B,834
chr1,2518188,2522908,FAM213B,834
chr1,2518188,2522908,FAM213B,834
chr1,2517898,2522908,FAM213B,834

如果第 3 列在一行中重复，则对第 4 列的值求和并得出此类总和的平均值。输出应该是:

chr1,700244,714068,LOC100288069,982
chr1,1568158,1570027,MMP23A,784
chr1,1849028,1850740,TMEM52,799
chr1,2281852,2284100,LOC100129534,934
chr1,2460183,2461684,HES5,834.5
chr1,2517898,2522908,FAM213B,867

我试过这个脚本，但它不起作用。谁能给我一些提示？

f1 = open('path', 'r')

reader1 = f1.read()

f3 = open('path/B_Media.txt','wb')

for line1 in f1:

    coluna = line1.split(',')
    chr = coluna[0]
    start = coluna[1]
    end = coluna[2]
    gene = coluna[3]
    valor_B = coluna[4]
    previous_line = current_line
    current_line = line
    gene2 = previous_line[3]
    soma_B2 = previous_line[4]
    soma_de_B = int(valor_B)+int(soma_B2)
    if gene == gene2:
            x += 1
            media_gene = soma_de_B/x
            output = chr + "," + start + "," + end + "," + gene + "," +valor_B+","+media_gene
            f3.write(output)
            f3.flush()
            print output

最佳答案

因为你需要知道接下来会发生什么(以逐行阅读的方式来说)，我会把阅读和写作分成两个不同的部分。

另外，csv -module 可能会派上用场，因为您不必处理任何特殊情况(如文本中的逗号等)并且读/写非常容易。使用 with 打开文件通常是一个好习惯，因为关闭它是自动处理的。

现在写一些代码:-)

from __future__ import division
import csv

gene = 3
valor_B = 4

data = []
with open('data.csv', 'r') as readfile:
    reader = csv.reader(readfile)
    for row in reader:
        data.append(row)

values_to_add = []
with open('B_Media.txt','wb') as writefile:
    writer = csv.writer(writefile)

    for i in range(len(data)):
        values_to_add.append(int(data[i][valor_B]))
        # if last row or row is different from previous, write it
        if i == len(data)-1 or data[i][gene] != data[i+1][gene]:
            data[i][valor_B] = sum(values_to_add)/len(values_to_add)
            writer.writerow(data[i])
            values_to_add = []

基本上它首先从输入文件中读取所有内容并将其放入data。然后，使用 输出文件，遍历每一行，执行以下操作:

将我们最终将写入的第 4 列的值添加到要写入的值列表中(也许不是现在，但最终)
如果我们遇到的一行不同于前一行或最后一行(我们也需要捕获那一行!)，写入输出。如果我们这样做，我们将取到目前为止收集的值列表的平均值(至少 1 个，可能 2 个或更多)。我们使用 sum()/len() 计算平均值，并用我们的新值替换相应的列，然后将其写入输出文件。
如果不是这种情况，什么都不做!第 4 列的值已在第一步中添加到列表中，因此我们可以向前移动一步到下一行。

结果:

chr1,700244,714068,LOC100288069,982.0
chr1,1567559,1570030,MMP23A,784.0
chr1,1849028,1850740,TMEM52,799.0
chr1,2281852,2284100,LOC100129534,867.0
chr1,2460183,2461684,HES5,834.5
chr1,2517898,2522908,FAM213B,834.0

(您可能认识 from __future__ import division 语句，它确保我们在除法时可以使用非整数值，例如 834.5。)

关于python - 验证前一行是否具有与当前行相同的字符串和另一列的总和值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31552996/

25

4

0

文章推荐： javascript - 将内联 CSS 转换为外部 CSS

文章推荐： javascript - CSS 过渡不会在模糊屏幕上开始

文章推荐： python curve_fit 没有给出合理的拟合结果

jsf - Bean 验证 VS JSF 验证
在 JSF2 应用程序中遇到验证属性的问题时，有两种主要方法。使用 Annotation 在 ManagedBean 上定义验证 @ManagedBean public class MyBean {
javascript - Jquery 验证。验证 "keyup"并在密码正确时隐藏表单
我想实现一个不常见的功能，我认为 jquery 验证插件将是最好的方法(如果您在没有插件的情况下建议和回答，我们也会欢迎)。我想在用户在输入字段中输入正确的单词后立即隐藏表单。我试过这个: $("
javascript - jQuery 验证 - 同一类的 NotEqual 验证
我有几个下拉菜单(类名为month_dropdown)，并且下拉菜单的数量不是恒定的。我怎样才能为它们实现 NotEqual 验证。我正在使用 jQuery 验证插件。这就是我写的 - jQuery
php - Javascript 中的 URL 验证 InstaGram 验证
我设法制作了这个网址验证代码并且它起作用了。但我面临着一个问题。我认为 stackoverflow 是获得解决方案的最佳场所。 function url_followers(){ var url=do
java - 验证/验证 Google Play 游戏服务 ID？
我目前正在使用后端服务，该服务允许用户在客户端应用程序上使用 Google Games 库登录。用户可以通过他们的 gplay ID 向我们发送信息，以便登录或恢复旧帐户。用户向我们发送以下内容，包
完整和部分 IP 的 python IP 验证 REGex 验证
我正在尝试验证输入以查看它是否是有效的 IP 地址(可能是部分地址)。可接受的输入:172、172.112、172.112.113、172.112.113.114 Not Acceptable 输入
regex - Mongoose 验证 : required : false, 验证 : regex, 问题与空值
我从 Mongoose 验证中得到这条消息: 'Validator failed for path phone with value ``' 这不应该发生，因为不需要电话。这是我的模型架构: var
openssl - 使用 .start_tls_s() 时如何强制 Python LDAP 验证/验证 SSL 证书
我一直在尝试使用Python-LDAP (版本 2.4.19)在 MacOS X 10.9.5 和 Python 2.7.9 下我想在调用 .start_tls_s() 后验证与给定 LDAP 服务
javascript - 在 VS 2017 中禁用一个项目的 ESLint/CSSLint/Javascript 验证/CSS 验证
我正在处理一个仅与 IE6 兼容的旧 javascript 项目(抱歉...)，我想仅在 VS 2017 中禁用此项目的 ESLint/CSLint/Javascript 验证/CSS 验证。我知道
spring - 使用 Hibernate Validator 验证 double 和 float 值 - bean 验证
我正在寻找一种方法来验证 Spring 命令 bean 中的 java.lang.Double 字段的最大值和最小值(一个值必须位于给定的值范围之间)，例如, public final class W
java - 无法执行目标org.apache.maven.plugins :maven-failsafe-plugin:2. 12:验证(验证)
我正在尝试在 springfuse(JavaEE 6 + Spring Framework (针对 Jetty、Tomcat、JBoss 等)) 和 maven 的帮助下构建我的 webapps 工作
Scalaz 验证
我试图在我们的项目中使用 scalaz 验证，但遇到了以下情况: def rate(username: String, params: Map[String, String]): Validation
YamlLint 验证
我有一个像这样的 Yaml 文件 name: hhh_aaa_bbb arguments: - !argument name: inputsss des
JavaScript 验证
我有一个表单，人们可以单击并向表单添加字段，并且我需要让它在单击时验证这些字段中的值。假设我单击它两次并获取 2 个独立的字段集，我需要旋转 % 以确保它在保存时等于 100。我已放入此函数以使其
JavaScript 验证
在我的页面中有一个选项可以创建新的日期字段输入框。用户可以根据需要创建尽可能多的“截止日期”和“起始日期”框。就像，日期_to1 || date_from1 日期到2 ||日期_from2 date
YamlLint 验证
我有一个像这样的 Yaml 文件 name: hhh_aaa_bbb arguments: - !argument name: inputsss des
Jquery 验证
有没有办法在动态字段上使用 jquery 验证表单。我想将其设置为必填字段我正在使用 Jsp 动态创建表单字段。喜欢等等...... 我想使用必需的表单字段验证此表单字段。最佳答
JavaScript 验证
嗨，任何人都可以通过提供 JavaScript 代码来帮助我验证用户名文本框不应包含数字，它只能包含一个字符。最佳答案使用正则表达式: (\d)+ 如果找到匹配项，则字符串中就有一个数字。关于J
JavaScript 验证
我有两个输入字段holidayDate和Description(id=tags) $(document).ready(function() {
JavaScript 验证 :
我遇到了这个问题，这些验证从电子邮件验证部分开始就停止工作。我只是不明白为什么即使经过几天的观察，只是想知道是否有人可以在这里指出我的错误？ Javascript部分: function valid

首页

博学

6Ren·AI

商城

python - 验证前一行是否具有与当前行相同的字符串和另一列的总和值