- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
使用 ipython 笔记本,pandas 数据框有 4 列:numerator1、numerator2、denominator1 和 denominator2。
在不遍历每条记录的情况下,我试图创建名为 FishersExact 的第五列。我希望列的值存储 scipy.stats.fisher_exact 返回的元组使用四列中每一列的值(或值的某些派生)作为我的输入。
df['FishersExact'] = scipy.stats.fisher_exact( [[df.numerator1, df.numerator2],
[df.denominator1 - df.numerator1 , df.denominator2 - df.numerator2]])
返回:
/home/kevin/anaconda/lib/python2.7/site-packages/scipy/stats/stats.pyc in fisher_exact(table, alternative)
2544 c = np.asarray(table, dtype=np.int64) # int32 is not enough for the algorithm
2545 if not c.shape == (2, 2):
-> 2546 raise ValueError("The input `table` must be of shape (2, 2).")
2547
2548 if np.any(c < 0):
ValueError: The input `table` must be of shape (2, 2).
当我只索引数据框的第一条记录时:
odds,pval = scipy.stats.fisher_exact([[df.numerator1[0], df.numerator2[0]],
[df.denominator1[0] - df.numerator1[0], df.denominator2[0] -df.numerator2[0]]])
这是返回:
1.1825710754 0.581151431104
我本质上是在尝试模拟类似于以下的算术功能:
df['freqnum1denom1'] = df.numerator1 / df.denominator1
它返回添加到数据框的新列,其中每个记录的频率都在新列中。
可能遗漏了一些东西,任何方向将不胜感激,谢谢!
最佳答案
看起来您正在构建一个 pandas
系列矩阵,并将其传递给函数。该函数需要一个标量矩阵;你可以多次调用它。这两件事并不完全相同。
(至少)有两种方法可以到达这里。
使用应用
你可以使用 pandas
的 apply
为此。
df['FishersExact'] = df.apply(
lambda r: scipy.stats.fisher_exact([[r.numerator1, ... ]]),
axis=1)
注意以下几点:
axis=1
对每一行应用一个函数。
在 lambda
中,r.numerator
是一个标量。
回归基础
Fischer's exact test可以描述为原始列中的向量化操作,应该会快很多。要最大程度地提高速度,您需要使用阶乘的矢量化版本(我不知道)。这甚至可以是一个单独的(很好!)SO 问题。
关于pandas - Fisher's Exact in scipy 作为使用 pandas 的新专栏,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30309416/
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。 这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
许多书籍都使用下图来说明 Fisher 线性判别分析的思想(该图来自 Pattern Recognition and Machine Learning,第 188 页) 我想知道如何用 R(或任何其他
我需要对矩阵 n x m 进行 Fisher 精确检验。我已经搜索了几个小时,但只找到了一个示例代码,但它是用 Fortran 语言编写的。我一直在使用 Wolfram 工作,我快要完成了,但我错过了
给定数据矩阵 X.shape = (n, d) 和单个预测变量的估计值 y_pred.shape = (n,),可以计算Fisher Information 我 喜欢这样: V = diags
我最近在 Lisp 中实现了 Fisher 的线性判别 (FLD)。到目前为止,我一直在使用 dim(<10) 的样本,其中 FLD 立即执行的数量为 10。今天早上,我使用 dim(5) 和 104
是否可以使用 Fisher 精确检验的矢量化来优化此计算,如果可以,如何优化?当 num_cases 运行时很麻烦> ~1000000。 import numpy as np from scipy.s
鉴于简单 A/B 测试的结果...... A B clicked 8 60 ignored 192 1940 (即 A 4% 和 B 3% 的 session 率) ... R
现在我正在开发一套文字游戏作为自学的一种方式(并重新创建一些我最喜欢的文字游戏!)在一位“真正”学习编程的 friend 的帮助下,我们实现了一个很好的排列方法在我的一门课上。它正在查找 3 个及以上
我是一般编码的新手,现在已经使用 javascript 有一段时间了 - 对于我在发布此问题时可能犯的任何失误,提前致歉。我研究了 2 个小时的大部分时间,无法自己得出答案,所以我在这里注册了一个帐户
我知道F-Y和reservoir sampling都可以实现shuffle array。比如我们在一个m * n的扫雷板上部署k个炸弹。 我已经完成了示例代码: public int[][] init
我正在尝试在 SPOJ 上解决这个问题: http://www.spoj.pl/problems/FISHER/ 我想不出解决这个问题的办法。我在 topcoder
所以我目前正在使用 Actionscript 3.0 制作问答游戏,我想使用 Fisher-Yates 随机播放算法随机播放问题: 这是我的代码: var questions:Array = [1,2
我并行启动几个依赖于随机数的 C/C++ 程序。对这个话题还算陌生,听说过段时间应该做seed。 此外,我使用 Fisher Yates 算法获得具有唯一随机打乱值的列表。但是,并行启动程序两次会为两
我正在编写一个小型技术分析库,其中包含 TA-lib 中不可用的项目。我从在 cTrader 上找到的示例开始并将其与 TradingView 版本中的代码进行匹配。 这是来自 TradingView
我正在使用标准的 Fisher-Yates 算法随机洗牌数组中的一副牌。但是,我不确定这是否真的会产生真实世界洗牌后所有可能排列的真实分布。 V8 的 Math.random 只有 128 位的内部状
我的数据框看起来像这样: 595.00000 18696 984.00200 32185 Group1 935.00000 18356 1589.000
我正在尝试在模拟 i.i.d 上实现 Fisher Scoring。 Poisson 数据,但出现堆栈溢出错误。我从函数中做了一些简单的打印,发现第一次迭代后猜测值没有改变。 fs_pois <- f
根据维基百科和Java标准库的实现,shuffling https://en.wikipedia.org/wiki/Fisher–Yates_shuffle (Fisher Yates Shuffli
我有一个由~3k 调查人员进行的~50k 测量的数据框。 INVESTIGATOR_ID \\\ SAMPLE_ID \\\ MEASUREMENT1000 \\\ 38942
意识到当某些事情看起来好得令人难以置信时,我想我会提出这个问题,希望能清除任何小 Sprite 。我回顾了我能找到的几个相关主题,但我的问题仍然存在。 我对 Haskell 比较陌生,在我的实验中,我
我是一名优秀的程序员,十分优秀!