- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
在以下数据集 (mcve_01.txt) 中:
mcve_01.txt
pos M1 M2 F1_x F1_y Sk1 S2 Sj
16230484 G/G G/G G T T/T T/T T/T
16230491 C/C C/C C T T/T . T/T
16230503 T/T T/T T T T/T . T/T
16230524 T/T T/T T A A/A A/A A/A
16230535 . . T C . . .
16232072 A/A A/A A G G/G G/G G/G
16232072 A/A A/A A G G/G G/G G/G
16229783 C/C C/C G C G/C G/C C|G
16229992 A/A A/A G A A/A A/A A|G
16230007 T/T T/T A T A|T A|T A|T
16230011 G/G G/G C G C|G C|G G/C
16230049 A/A A/A T A . A/T A/T
16230174 . . T C T|C T|C C|T
16230190 A/A A/A T A G|T T|G T|G
16230260 A/A A/A G A G/G G/G G/G
16230260 A/A A/A G A G/G G/G G/G
16232772 A/A A/A C A C/C C/C C/C
16232793 C/C C/C T C T/T T/T T/T
16232793 C/C C/C T C T/T T/T T/T
16232282 T/T T/T T A A/A A/A A/A
我正在尝试运行马尔可夫模型。
下面是我的代码:
import pandas as pd
import itertools as it
mcve_data = pd.read_csv('mcve_01.txt', sep='\t')
mcve_data.set_index(['pos'], inplace = True)
mcve_list = mcve_data.applymap(lambda c:[list(c)])
注意:我必须将每列中的值转换为列表,以便我可以根据条件运行所需的 itertools.product 或 zip。
def mapfun(c):
cstr = ''.join(map(str, c))
if '.' in cstr:
return '.'
if '/' in cstr:
sep = '/'
fun = it.product
else:
sep = '|'
fun = zip
return ','.join('g'.join(t) for t in fun(*c) if sep not in t)
现在(下),应用该函数进行马尔可夫建模。
mcve_mm = (mcve_list+mcve_list.shift(1)).dropna(how='all').\
applymap(mapfun)
注意:所以,在上面的代码中(mcve_list+mcve_list.shift(1))
从同一列的两行读取值以应用马尔可夫链。
print(mcve_mm)
pd.DataFrame.to_csv(mcve_mm, 'mcve_mm.txt', sep='\t', index=True)
输出(mcve_mm.txt)是:
pos M1 M2 F1_x F1_y Sk1 S2 Sj
16230491 CgG,CgG,CgG,CgG CgG,CgG,CgG,CgG CgG TgT TgT,TgT,TgT,TgT . TgT,TgT,TgT,TgT
16230503 TgC,TgC,TgC,TgC TgC,TgC,TgC,TgC TgC TgT TgT,TgT,TgT,TgT . TgT,TgT,TgT,TgT
16230524 TgT,TgT,TgT,TgT TgT,TgT,TgT,TgT TgT AgT AgT,AgT,AgT,AgT . AgT,AgT,AgT,AgT
16230535 . . TgT CgA . . .
16232072 . . AgT GgC . . .
16232072 AgA,AgA,AgA,AgA AgA,AgA,AgA,AgA AgA GgG GgG,GgG,GgG,GgG GgG,GgG,GgG,GgG GgG,GgG,GgG,GgG
16229783 CgA,CgA,CgA,CgA CgA,CgA,CgA,CgA GgA CgG GgG,GgG,CgG,CgG GgG,GgG,CgG,CgG CgG,CgG,|gG,|gG,GgG,GgG
16229992 AgC,AgC,AgC,AgC AgC,AgC,AgC,AgC GgG AgC AgG,AgC,AgG,AgC AgG,AgC,AgG,AgC AgC,GgG
16230007 TgA,TgA,TgA,TgA TgA,TgA,TgA,TgA AgG TgA AgA,AgA,|gA,|gA,TgA,TgA AgA,AgA,|gA,|gA,TgA,TgA AgA,TgG
16230011 GgT,GgT,GgT,GgT GgT,GgT,GgT,GgT CgA GgT CgA,GgT CgA,GgT GgA,Gg|,GgT,CgA,Cg|,CgT
16230049 AgG,AgG,AgG,AgG AgG,AgG,AgG,AgG TgC AgG . AgC,Ag|,AgG,TgC,Tg|,TgG AgG,AgC,TgG,TgC
16230174 . . TgT CgA . TgA,TgT,|gA,|gT,CgA,CgT CgA,CgT,|gA,|gT,TgA,TgT
16230190 . . TgT AgC GgT,TgC TgT,GgC TgC,GgT
16230260 AgA,AgA,AgA,AgA AgA,AgA,AgA,AgA GgT AgA GgG,Gg|,GgT,GgG,Gg|,GgT GgT,Gg|,GgG,GgT,Gg|,GgG GgT,Gg|,GgG,GgT,Gg|,GgG
16230260 AgA,AgA,AgA,AgA AgA,AgA,AgA,AgA GgG AgA GgG,GgG,GgG,GgG GgG,GgG,GgG,GgG GgG,GgG,GgG,GgG
16232772 AgA,AgA,AgA,AgA AgA,AgA,AgA,AgA CgG AgA CgG,CgG,CgG,CgG CgG,CgG,CgG,CgG CgG,CgG,CgG,CgG
16232793 CgA,CgA,CgA,CgA CgA,CgA,CgA,CgA TgC CgA TgC,TgC,TgC,TgC TgC,TgC,TgC,TgC TgC,TgC,TgC,TgC
16232793 CgC,CgC,CgC,CgC CgC,CgC,CgC,CgC TgT CgC TgT,TgT,TgT,TgT TgT,TgT,TgT,TgT TgT,TgT,TgT,TgT
16232282 TgC,TgC,TgC,TgC TgC,TgC,TgC,TgC TgT AgC AgT,AgT,AgT,AgT AgT,AgT,AgT,AgT AgT,AgT,AgT,AgT
因此,输出文件中有几个时髦的输出。 类似于 GgG,Gg|,GgT,GgG,Gg|,GgT
的内容在 16230260 行。
我正在努力摆脱这类问题。
问题在于代码:
if '/' in cstr:
sep = '/'
fun = it.product
当 c(列表)是这样的:
if '/' in cstr:
print(c)
print(type(c))
sep = '/'
fun = it.product
一些 c(由于移位而从两行读取)具有以下结构我认为这是问题所在。
[['C', '|', 'G'], ['G', '/', 'G']]
<class 'list'>
因此,it.product 将竖线 (|) 与另一个列表中的剩余元素相乘。
它尝试过:
if '/' in cstr:
for x in c:
while '|' in x:
x.remove('|')
# but I think this is not updating c but sometimes affecting the c in other columns by borrowing the condition met from previous line.
sep = '/'
fun = it.product
我也试过:
for x in c:
while '|' in x:
c == list(''.join(x).strip('|') for x in c)
将列表转换为字符串,然后去除管道(|),然后将其转换回列表,但遇到错误。
那么,问题是:如果在 c 中运行它时如何删除管道 (|)。product for lines/c like:
[['C', '|', 'G'], ['G', '/', 'G']]
<class 'list'>
以下类型的 c 的预期输出:
[['C', '|', 'G'], ['G', '/', 'G']]
或 [['C', '/', 'G'], ['G', '/', 'G']]
是一样的:CgG, CgG, GgG, GgG
最佳答案
我建议按如下方式更改函数:
from itertools import product
from functools import partial
def mapfun(c):
if any(['.' in l for l in c]):
return '.'
if all(['|' in l for l in c]):
fun = zip
else:
fun = product
return ','.join('g'.join(t) for t in fun(*map(mapfun.filt,c)))
mapfun.filt_set = set(['|','/'])
mapfun.filt = partial(filter,lambda l: not (l in mapfun.filt_set))
print(mapfun([['C', '|', 'G'], ['G', '|', 'G']]))
print(mapfun([['C', '/', 'G'], ['G', '/', 'G']]))
print(mapfun([['C', '|', 'G'], ['G', '/', 'G']]))
print(mapfun([['C', '/', 'G'], ['G', '|', 'G']]))
这会产生输出:
CgG,GgG
CgG,CgG,GgG,GgG
CgG,CgG,GgG,GgG
CgG,CgG,GgG,GgG
即zip
用于第一个示例,itertools.product
用于所有后续示例。
解释:
['.' in l for l in c]
是一个 bool 值列表,当且仅当相应的参数包含一个点时,这些 bool 值才为真。然后 any
用于检查是否有任何参数包含“.”。filt
是在 mapfun 之外定义的,这样它就不必在每次调用 mapfun
时重新计算 - 注意污染 namespace ,它被添加为函数对象的一个属性(参见 What is the Python equivalent of static variables inside a function? )partial(filter, f)
与 lambda x: filter(f,x)
相同filt_set
中,因此应将其删除*map(mapfun.filt,c)
简单地使用 mapfun.filt
过滤所有参数,然后将它们作为参数传递给所选函数 f
关于python - 如何通过删除列表中的特定元素来为给定列表运行 itertools 产品?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42146437/
在开发中的网页上,我在 IE 上遇到此错误 element = $(element); 此代码位于prototype.js 预期对象 如何消除此错误。 更新: 现场也使用了 jQuery。 最佳答
我有两个大小相同的嵌套数组: Array1 =[[1, 2], [], [2, 3]] Array2= [[1, 4], [8, 11], [3, 6]] 我需要将它们合并到一个数组中,如下所示: A
我有一些 jQuery 代码,当单击具有特定 ID 的项目时运行。当 ID 是 的一部分时,它就可以工作。元素,但当它位于 中时则不然元素。为什么会这样呢?我想使用 an,因为如果用户关闭了 Ja
Flex-box 规范 3声明 flex 元素不是 block 容器: A flex item establishes a new formatting context for its content
我遇到了一个意想不到的问题。 HTML JS $(function() { var $divs = $('.myDiv'); // create new div not in
我使用 Bootstrap 和 Ember.js 得到了一个无序列表。每个列表项都是一个显示新帖子的链接,每当您单击该链接时,Ember 都会添加类 active默认情况下。我正在使用 Bootstr
我正在尝试让一个函数正常工作,但运气不佳,所以我想向 Stackoverflow 智囊团提出一个新手问题! 基本上,我有一个表单,并且循环遍历所有元素以查看是否存在自定义数据属性。如果存在,则保持该元
我想映射一个可选数组,删除那些 nil 值,并使用另一个函数映射非 nil 值。 我知道我可以通过使用 compactMap 然后使用常规 map 来实现这一点,但我只想遍历数组一次。 我为此实现了一
我如何定位 li 元素,除非它们出现在 之后元素?换句话说,我想针对步骤而不是注释。 我尝试向 OL 添加一个我想从选择中排除的类,但我想出的代码不起作用。 (顺便说一句,重构 html 不是一种选
Warning 1 The element 'system.webServer' has invalid child element 'rewrite'. List of possible eleme
我正在尝试编写一个脚本,该脚本将遍历 HTML 源并创建 DOM 的 JSON 文件,然后使用 d3.js 在 TreeView 中显示该文件。我遇到的问题是不仅希望显示元素(TITLE、P、LI 等
我有以下 HTML 表单:- Option 1 Option 2
我试图在选定的 HTML 元素之后选择下一个具有类名 slider-value 的 span 元素。我尝试了多种解决方案,但没有一个有效。 我可以通过 id 选择它,但我不希望那样做使代码冗余。 $(
如果电子邮件地址无效,我想在屏幕上显示一条消息“请输入有效的电子邮件地址”。 body 元素的innerHTML 语句工作正常,但我用于p 元素的innerHTML 语句不起作用。 有一次,当我测试它
以下 jQuery 代码调用 ul 元素,查找元素内的前 三个 li 列表项,并隐藏剩余的 li 项目。然后,它附加一个 li 元素,其中显示“显示更多...”,并且在单击时显示之前隐藏的列表项。 (
我问了a question早些时候关于将编辑/删除链接与 h1 元素内联的最佳方法。我能够通过给出的答案实现这一点,但我现在有额外的要求,我需要在 h1 下方显示一个段落并编辑/删除链接。 到目前为止
我使用 MVC 4 和 knockout.js 库版本 2.1.0 显示从服务器检索到的大量文件的表中的以下摘录。 0)"> 正在正确检索数据,
我创建了一个脚本,该脚本在鼠标悬停在父容器上时激活,并且应该将其子元素移离鼠标。我目前已经让它工作了,但是代码的某些部分似乎与 REACT 代码应该是什么样子相矛盾。特别是两个部分。 我在渲染函数中使
我是 JS 新手,正在尝试理解项目 https://github.com/tastejs/todomvc 的代码 请参阅屏幕截图,我尝试对 button X 以及其父元素 div 设置断点,但在这两种
例如,假设有一个带有奇特颜色的标记: Something written here 使用 Visual Studio 2017 和 MVC 5 元素,有没有办法检查和定位当前应用了哪些样式,以及负责它
我是一名优秀的程序员,十分优秀!