python - 如何通过删除列表中的特定元素来为给定列表运行 itertools 产品？-6ren

python - 如何通过删除列表中的特定元素来为给定列表运行 itertools 产品？

转载作者：太空宇宙更新时间：2023-11-04 02:56:40

在以下数据集 (mcve_01.txt) 中:

mcve_01.txt

pos         M1     M2      F1_x     F1_y    Sk1     S2    Sj
16230484    G/G   G/G       G       T        T/T    T/T   T/T
16230491    C/C   C/C       C       T        T/T    .     T/T
16230503    T/T   T/T       T       T        T/T    .     T/T
16230524    T/T   T/T       T       A        A/A    A/A   A/A
16230535    .     .         T       C        .      .       .
16232072    A/A   A/A       A       G        G/G    G/G   G/G
16232072    A/A   A/A       A       G        G/G    G/G   G/G
16229783    C/C   C/C       G       C        G/C    G/C   C|G
16229992    A/A   A/A       G       A        A/A    A/A   A|G
16230007    T/T   T/T       A       T        A|T    A|T   A|T
16230011    G/G   G/G       C       G        C|G    C|G   G/C
16230049    A/A   A/A       T       A        .      A/T   A/T
16230174    .      .        T       C        T|C    T|C   C|T
16230190    A/A   A/A       T       A        G|T    T|G   T|G
16230260    A/A   A/A       G       A        G/G    G/G   G/G
16230260    A/A   A/A       G       A        G/G    G/G   G/G
16232772    A/A   A/A       C       A        C/C    C/C   C/C
16232793    C/C   C/C       T       C        T/T    T/T   T/T
16232793    C/C   C/C       T       C        T/T    T/T   T/T
16232282    T/T   T/T       T       A        A/A    A/A   A/A

我正在尝试运行马尔可夫模型。

下面是我的代码:

import pandas as pd
import itertools as it

mcve_data = pd.read_csv('mcve_01.txt', sep='\t')

mcve_data.set_index(['pos'], inplace = True)

mcve_list = mcve_data.applymap(lambda c:[list(c)])

注意:我必须将每列中的值转换为列表，以便我可以根据条件运行所需的 itertools.product 或 zip。

def mapfun(c):
    cstr = ''.join(map(str, c))
    if '.' in cstr:
        return '.'

    if '/' in cstr:
        sep = '/'
        fun = it.product

    else:
        sep = '|'
        fun = zip

    return ','.join('g'.join(t) for t in fun(*c) if sep not in t)

现在(下)，应用该函数进行马尔可夫建模。

mcve_mm = (mcve_list+mcve_list.shift(1)).dropna(how='all').\
applymap(mapfun)

注意:所以，在上面的代码中(mcve_list+mcve_list.shift(1))从同一列的两行读取值以应用马尔可夫链。

print(mcve_mm)

pd.DataFrame.to_csv(mcve_mm, 'mcve_mm.txt', sep='\t', index=True)

输出(mcve_mm.txt)是:

    pos     M1          M2          F1_x    F1_y    Sk1             S2              Sj
16230491    CgG,CgG,CgG,CgG     CgG,CgG,CgG,CgG     CgG TgT TgT,TgT,TgT,TgT         .               TgT,TgT,TgT,TgT
16230503    TgC,TgC,TgC,TgC     TgC,TgC,TgC,TgC     TgC TgT TgT,TgT,TgT,TgT         .               TgT,TgT,TgT,TgT
16230524    TgT,TgT,TgT,TgT     TgT,TgT,TgT,TgT     TgT AgT AgT,AgT,AgT,AgT         .               AgT,AgT,AgT,AgT
16230535    .           .           TgT CgA .               .               .
16232072    .           .           AgT GgC .               .               .
16232072    AgA,AgA,AgA,AgA     AgA,AgA,AgA,AgA     AgA GgG GgG,GgG,GgG,GgG         GgG,GgG,GgG,GgG         GgG,GgG,GgG,GgG
16229783    CgA,CgA,CgA,CgA     CgA,CgA,CgA,CgA     GgA CgG GgG,GgG,CgG,CgG         GgG,GgG,CgG,CgG         CgG,CgG,|gG,|gG,GgG,GgG
16229992    AgC,AgC,AgC,AgC     AgC,AgC,AgC,AgC     GgG AgC AgG,AgC,AgG,AgC         AgG,AgC,AgG,AgC         AgC,GgG
16230007    TgA,TgA,TgA,TgA     TgA,TgA,TgA,TgA     AgG TgA AgA,AgA,|gA,|gA,TgA,TgA     AgA,AgA,|gA,|gA,TgA,TgA     AgA,TgG
16230011    GgT,GgT,GgT,GgT     GgT,GgT,GgT,GgT     CgA GgT CgA,GgT CgA,GgT         GgA,Gg|,GgT,CgA,Cg|,CgT
16230049    AgG,AgG,AgG,AgG     AgG,AgG,AgG,AgG     TgC AgG .               AgC,Ag|,AgG,TgC,Tg|,TgG     AgG,AgC,TgG,TgC
16230174    .           .           TgT CgA .               TgA,TgT,|gA,|gT,CgA,CgT     CgA,CgT,|gA,|gT,TgA,TgT
16230190    .           .           TgT AgC GgT,TgC             TgT,GgC             TgC,GgT
16230260    AgA,AgA,AgA,AgA     AgA,AgA,AgA,AgA     GgT AgA GgG,Gg|,GgT,GgG,Gg|,GgT     GgT,Gg|,GgG,GgT,Gg|,GgG     GgT,Gg|,GgG,GgT,Gg|,GgG
16230260    AgA,AgA,AgA,AgA     AgA,AgA,AgA,AgA     GgG AgA GgG,GgG,GgG,GgG         GgG,GgG,GgG,GgG         GgG,GgG,GgG,GgG
16232772    AgA,AgA,AgA,AgA     AgA,AgA,AgA,AgA     CgG AgA CgG,CgG,CgG,CgG         CgG,CgG,CgG,CgG         CgG,CgG,CgG,CgG
16232793    CgA,CgA,CgA,CgA     CgA,CgA,CgA,CgA     TgC CgA TgC,TgC,TgC,TgC         TgC,TgC,TgC,TgC         TgC,TgC,TgC,TgC
16232793    CgC,CgC,CgC,CgC     CgC,CgC,CgC,CgC     TgT CgC TgT,TgT,TgT,TgT         TgT,TgT,TgT,TgT         TgT,TgT,TgT,TgT
16232282    TgC,TgC,TgC,TgC     TgC,TgC,TgC,TgC     TgT AgC AgT,AgT,AgT,AgT         AgT,AgT,AgT,AgT         AgT,AgT,AgT,AgT

因此，输出文件中有几个时髦的输出。 类似于 GgG,Gg|,GgT,GgG,Gg|,GgT 的内容在 16230260 行。

我正在努力摆脱这类问题。

问题在于代码:

    if '/' in cstr:
        sep = '/'
        fun = it.product

当 c(列表)是这样的:

    if '/' in cstr:
        print(c)
        print(type(c))
        sep = '/'
        fun = it.product

一些 c(由于移位而从两行读取)具有以下结构我认为这是问题所在。

[['C', '|', 'G'], ['G', '/', 'G']]

<class 'list'>

因此，it.product 将竖线 (|) 与另一个列表中的剩余元素相乘。

它尝试过:

if '/' in cstr:
    for x in c:
       while '|' in x:
            x.remove('|')  

# but I think this is not updating c but sometimes affecting the c in other columns by borrowing the condition met from previous line.

    sep = '/'
    fun = it.product

我也试过:

    for x in c:
       while '|' in x:
            c == list(''.join(x).strip('|') for x in c)

将列表转换为字符串，然后去除管道(|)，然后将其转换回列表，但遇到错误。

那么，问题是:如果在 c 中运行它时如何删除管道 (|)。product for lines/c like:

[['C', '|', 'G'], ['G', '/', 'G']]

<class 'list'>

以下类型的 c 的预期输出:

[['C', '|', 'G'], ['G', '/', 'G']]或 [['C', '/', 'G'], ['G', '/', 'G']]

是一样的:CgG, CgG, GgG, GgG

最佳答案

我建议按如下方式更改函数:

from itertools import product
from functools import partial

def mapfun(c):
    if any(['.' in l for l in c]):
        return '.'

    if all(['|' in l for l in c]):
        fun = zip
    else:
        fun = product

    return ','.join('g'.join(t) for t in fun(*map(mapfun.filt,c)))

mapfun.filt_set = set(['|','/'])
mapfun.filt = partial(filter,lambda l: not (l in mapfun.filt_set))

print(mapfun([['C', '|', 'G'], ['G', '|', 'G']]))
print(mapfun([['C', '/', 'G'], ['G', '/', 'G']]))
print(mapfun([['C', '|', 'G'], ['G', '/', 'G']]))
print(mapfun([['C', '/', 'G'], ['G', '|', 'G']]))

这会产生输出:

CgG,GgG
CgG,CgG,GgG,GgG
CgG,CgG,GgG,GgG
CgG,CgG,GgG,GgG

即zip 用于第一个示例，itertools.product 用于所有后续示例。

解释:

要确定任何条件(“.”出现在任何参数中或“|”出现在所有参数中)是否为真，使用列表推导式:例如 ['.' in l for l in c] 是一个 bool 值列表，当且仅当相应的参数包含一个点时，这些 bool 值才为真。然后 any 用于检查是否有任何参数包含“.”。
变量 filt 是在 mapfun 之外定义的，这样它就不必在每次调用 mapfun 时重新计算 - 注意污染 namespace ，它被添加为函数对象的一个属性(参见 What is the Python equivalent of static variables inside a function? )
请注意 partial(filter, f) 与 lambda x: filter(f,x) 相同
partial 中的 lambda 仅检查元素是否在 filt_set 中，因此应将其删除
*map(mapfun.filt,c) 简单地使用 mapfun.filt 过滤所有参数，然后将它们作为参数传递给所选函数 f

关于python - 如何通过删除列表中的特定元素来为给定列表运行 itertools 产品？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42146437/

文章推荐： python - 在 Pandas 数据框中连接多索引信息

文章推荐： c - 如何在 linux 中对齐 kmalloc() 地址

javascript - 元素 = $(元素);对象预期错误？
在开发中的网页上，我在 IE 上遇到此错误 element = $(element); 此代码位于prototype.js 预期对象如何消除此错误。更新: 现场也使用了 jQuery。最佳答
arrays - 如果元素本身是数组，合并两个数组(元素 + 元素)的最佳方法是什么
我有两个大小相同的嵌套数组: Array1 =[[1, 2], [], [2, 3]] Array2= [[1, 4], [8, 11], [3, 6]] 我需要将它们合并到一个数组中，如下所示: A
jQuery 不适用于
元素，但不适用于元素
我有一些 jQuery 代码，当单击具有特定 ID 的项目时运行。当 ID 是的一部分时，它就可以工作。元素，但当它位于中时则不然元素。为什么会这样呢？我想使用 an，因为如果用户关闭了 Ja
html - 如何制作 flex 元素 block 元素？
Flex-box 规范 3声明 flex 元素不是 block 容器: A flex item establishes a new formatting context for its content
javascript - jquery 在有序堆栈中添加 not-in-dom 元素(in-dom 元素)
我遇到了一个意想不到的问题。 HTML JS $(function() { var $divs = $('.myDiv'); // create new div not in
javascript - 制作
元素 'active' 而不是元素
我使用 Bootstrap 和 Ember.js 得到了一个无序列表。每个列表项都是一个显示新帖子的链接，每当您单击该链接时，Ember 都会添加类 active默认情况下。我正在使用 Bootstr
javascript - 循环遍历 DOM 元素，包括 span 元素
我正在尝试让一个函数正常工作，但运气不佳，所以我想向 Stackoverflow 智囊团提出一个新手问题! 基本上，我有一个表单，并且循环遍历所有元素以查看是否存在自定义数据属性。如果存在，则保持该元
arrays - 是否有内置函数来映射非 nil 元素，并删除数组的 nil 元素？
我想映射一个可选数组，删除那些 nil 值，并使用另一个函数映射非 nil 值。我知道我可以通过使用 compactMap 然后使用常规 map 来实现这一点，但我只想遍历数组一次。我为此实现了一
jquery - 定位 li 元素，除非前面有非 li 元素
我如何定位 li 元素，除非它们出现在之后元素？换句话说，我想针对步骤而不是注释。我尝试向 OL 添加一个我想从选择中排除的类，但我想出的代码不起作用。 (顺便说一句，重构 html 不是一种选
asp.net - 元素 > system.webServer' 有无效的子元素 > 元素 'rewrite'
Warning 1 The element 'system.webServer' has invalid child element 'rewrite'. List of possible eleme
JavaScript 从非结束节点 HTML 元素(例如 LI 元素)获取文本值
我正在尝试编写一个脚本，该脚本将遍历 HTML 源并创建 DOM 的 JSON 文件，然后使用 d3.js 在 TreeView 中显示该文件。我遇到的问题是不仅希望显示元素(TITLE、P、LI 等
jQuery SlideUp 元素 A 如果可见，则 SlideDown 元素 B
我有以下 HTML 表单:- Option 1 Option 2
javascript - 选择 HTML 元素 Jquery 之后的下一个 span 元素
我试图在选定的 HTML 元素之后选择下一个具有类名 slider-value 的 span 元素。我尝试了多种解决方案，但没有一个有效。我可以通过 id 选择它，但我不希望那样做使代码冗余。 $(
javascript - innerHTML 适用于 body 元素，但不适用于 p 元素
如果电子邮件地址无效，我想在屏幕上显示一条消息“请输入有效的电子邮件地址”。 body 元素的innerHTML 语句工作正常，但我用于p 元素的innerHTML 语句不起作用。有一次，当我测试它
javascript - jQuery 显示隐藏的 li 元素，然后隐藏可见的 li 元素
以下 jQuery 代码调用 ul 元素，查找元素内的前三个 li 列表项，并隐藏剩余的 li 项目。然后，它附加一个 li 元素，其中显示“显示更多...”，并且在单击时显示之前隐藏的列表项。 (
html - 如何显示一个 h1 元素，旁边有一个内联元素，下面有一个 p 元素？
我问了a question早些时候关于将编辑/删除链接与 h1 元素内联的最佳方法。我能够通过给出的答案实现这一点，但我现在有额外的要求，我需要在 h1 下方显示一个段落并编辑/删除链接。到目前为止
knockout.js foreach 在表中重复 td 元素，但不重复 tr 元素
我使用 MVC 4 和 knockout.js 库版本 2.1.0 显示从服务器检索到的大量文件的表中的以下摘录。 0)"> 正在正确检索数据，
reactjs - 如何在 React 组件中定位 DOM 元素，或者应该避免一起定位 DOM 元素？
我创建了一个脚本，该脚本在鼠标悬停在父容器上时激活，并且应该将其子元素移离鼠标。我目前已经让它工作了，但是代码的某些部分似乎与 REACT 代码应该是什么样子相矛盾。特别是两个部分。我在渲染函数中使
javascript - 断点不适用于 Button 或 div 元素，但适用于 li 元素
我是 JS 新手，正在尝试理解项目 https://github.com/tastejs/todomvc 的代码请参阅屏幕截图，我尝试对 button X 以及其父元素 div 设置断点，但在这两种
html - 检查哪些样式应用于 MVC 5 元素 View 中的 HTML 元素
例如，假设有一个带有奇特颜色的标记: Something written here 使用 Visual Studio 2017 和 MVC 5 元素，有没有办法检查和定位当前应用了哪些样式，以及负责它

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何通过删除列表中的特定元素来为给定列表运行 itertools 产品？