pandas - Fisher's Exact in scipy 作为使用 pandas 的新专栏-6ren

pandas - Fisher's Exact in scipy 作为使用 pandas 的新专栏

转载作者：行者123 更新时间：2023-12-03 12:37:41

29

4

使用 ipython 笔记本，pandas 数据框有 4 列:numerator1、numerator2、denominator1 和 denominator2。

在不遍历每条记录的情况下，我试图创建名为 FishersExact 的第五列。我希望列的值存储 scipy.stats.fisher_exact 返回的元组使用四列中每一列的值(或值的某些派生)作为我的输入。

df['FishersExact'] = scipy.stats.fisher_exact( [[df.numerator1, df.numerator2],
[df.denominator1 - df.numerator1 , df.denominator2 - df.numerator2]])

返回:

/home/kevin/anaconda/lib/python2.7/site-packages/scipy/stats/stats.pyc in fisher_exact(table, alternative)
2544     c = np.asarray(table, dtype=np.int64)  # int32 is not enough for the algorithm
2545     if not c.shape == (2, 2):
-> 2546         raise ValueError("The input `table` must be of shape (2, 2).")
2547 
2548     if np.any(c < 0):

ValueError: The input `table` must be of shape (2, 2).

当我只索引数据框的第一条记录时:

odds,pval = scipy.stats.fisher_exact([[df.numerator1[0], df.numerator2[0]], 
[df.denominator1[0] - df.numerator1[0], df.denominator2[0] -df.numerator2[0]]])

这是返回:

1.1825710754 0.581151431104

我本质上是在尝试模拟类似于以下的算术功能:

df['freqnum1denom1'] = df.numerator1 / df.denominator1

它返回添加到数据框的新列，其中每个记录的频率都在新列中。

可能遗漏了一些东西，任何方向将不胜感激，谢谢!

最佳答案

看起来您正在构建一个 pandas 系列矩阵，并将其传递给函数。该函数需要一个标量矩阵；你可以多次调用它。这两件事并不完全相同。

(至少)有两种方法可以到达这里。

使用应用

你可以使用 pandas 的 apply为此。

df['FishersExact'] = df.apply(
    lambda r: scipy.stats.fisher_exact([[r.numerator1, ... ]]),
    axis=1)

注意以下几点:

axis=1 对每一行应用一个函数。
在 lambda 中，r.numerator 是一个标量。

回归基础

Fischer's exact test可以描述为原始列中的向量化操作，应该会快很多。要最大程度地提高速度，您需要使用阶乘的矢量化版本(我不知道)。这甚至可以是一个单独的(很好!)SO 问题。

关于pandas - Fisher's Exact in scipy 作为使用 pandas 的新专栏，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30309416/

29

4

0

文章推荐： sql - SQL更新撤消

文章推荐： search - F# 文档是否可以按类型搜索函数？

文章推荐： MIFARE DESFire EV1 内容删除

c - Fisher 数检查结果不正确
已关闭。这个问题是 not reproducible or was caused by typos 。目前不接受答案。这个问题是由拼写错误或无法再重现的问题引起的。虽然类似的问题可能是 on-top
再现 Fisher 线性判别图
许多书籍都使用下图来说明 Fisher 线性判别分析的思想(该图来自 Pattern Recognition and Machine Learning，第 188 页) 我想知道如何用 R(或任何其他
java - Fisher 精确检验的算法或数学是什么？
我需要对矩阵 n x m 进行 Fisher 精确检验。我已经搜索了几个小时，但只找到了一个示例代码，但它是用 Fortran 语言编写的。我一直在使用 Wolfram 工作，我快要完成了，但我错过了
python - Fisher 信息计算扩展
给定数据矩阵 X.shape = (n, d) 和单个预测变量的估计值 y_pred.shape = (n,)，可以计算Fisher Information 我喜欢这样: V = diags
performance - Fisher 判别计算时间
我最近在 Lisp 中实现了 Fisher 的线性判别 (FLD)。到目前为止，我一直在使用 dim(<10) 的样本，其中 FLD 立即执行的数量为 10。今天早上，我使用 dim(5) 和 104
python - 如何矢量化 Fisher 精确检验？
是否可以使用 Fisher 精确检验的矢量化来优化此计算，如果可以，如何优化？当 num_cases 运行时很麻烦> ~1000000。 import numpy as np from scipy.s
r - A/B Fisher 检验显着性的样本大小
鉴于简单 A/B 测试的结果...... A B clicked 8 60 ignored 192 1940 (即 A 4% 和 B 3% 的 session 率) ... R
c# - Fisher-Yates 在单个字符串上随机播放还是使用等长排列？
现在我正在开发一套文字游戏作为自学的一种方式(并重新创建一些我最喜欢的文字游戏!)在一位“真正”学习编程的 friend 的帮助下，我们实现了一个很好的排列方法在我的一门课上。它正在查找 3 个及以上
Javascript fisher-yates 帮助
我是一般编码的新手，现在已经使用 javascript 有一段时间了 - 对于我在发布此问题时可能犯的任何失误，提前致歉。我研究了 2 个小时的大部分时间，无法自己得出答案，所以我在这里注册了一个帐户
algorithm - Fisher-Yates 随机抽样和水库抽样之间的区别
我知道F-Y和reservoir sampling都可以实现shuffle array。比如我们在一个m * n的扫雷板上部署k个炸弹。我已经完成了示例代码: public int[][] init
algorithm - SPOJ FISHER 的想法
我正在尝试在 SPOJ 上解决这个问题: http://www.spoj.pl/problems/FISHER/ 我想不出解决这个问题的办法。我在 topcoder
arrays - Fisher-Yates 洗牌算法错误
所以我目前正在使用 Actionscript 3.0 制作问答游戏，我想使用 Fisher-Yates 随机播放算法随机播放问题: 这是我的代码: var questions:Array = [1,2
c - Fisher Yates 算法在系统时间播种时在并行启动的程序中返回相同顺序的数字
我并行启动几个依赖于随机数的 C/C++ 程序。对这个话题还算陌生，听说过段时间应该做seed。此外，我使用 Fisher Yates 算法获得具有唯一随机打乱值的列表。但是，并行启动程序两次会为两
c# - 如何正确计算 Fisher 变换指标
我正在编写一个小型技术分析库，其中包含 TA-lib 中不可用的项目。我从在 cTrader 上找到的示例开始并将其与 TradingView 版本中的代码进行匹配。这是来自 TradingView
javascript - Fisher-Yates 洗牌可以产生所有纸牌排列吗？
我正在使用标准的 Fisher-Yates 算法随机洗牌数组中的一副牌。但是，我不确定这是否真的会产生真实世界洗牌后所有可能排列的真实分布。 V8 的 Math.random 只有 128 位的内部状
R For 循环执行 Fisher 测试 - 错误消息
我的数据框看起来像这样: 595.00000 18696 984.00200 32185 Group1 935.00000 18356 1589.000
r - 在 R-fisher 评分中实现递归函数的问题
我正在尝试在模拟 i.i.d 上实现 Fisher Scoring。 Poisson 数据，但出现堆栈溢出错误。我从函数中做了一些简单的打印，发现第一次迭代后猜测值没有改变。 fs_pois <- f
algorithm - Fisher-Yates Shuffle 向后执行的正确性
根据维基百科和Java标准库的实现，shuffling https://en.wikipedia.org/wiki/Fisher–Yates_shuffle (Fisher Yates Shuffli
对 R 中数据框的每一行运行 Fisher 测试
我有一个由~3k 调查人员进行的~50k 测量的数据框。 INVESTIGATOR_ID \\\ SAMPLE_ID \\\ MEASUREMENT1000 \\\ 38942
haskell - 我的 Fisher-Yates 洗牌有什么问题吗？
意识到当某些事情看起来好得令人难以置信时，我想我会提出这个问题，希望能清除任何小 Sprite 。我回顾了我能找到的几个相关主题，但我的问题仍然存在。我对 Haskell 比较陌生，在我的实验中，我

首页

博学

6Ren·AI

商城

pandas - Fisher's Exact in scipy 作为使用 pandas 的新专栏