gpt4 book ai didi

python - 计算 pandas DataFrame 中值的频率

转载 作者:行者123 更新时间:2023-12-05 02:58:13 30 4
gpt4 key购买 nike

拥有这个 pandas.core.frame.DataFrame:

Gorilla     A  T  C  C  A  G  C  T
Dog G G G C A A C T
Humano A T G G A T C T
Drosophila A A G C A A C C
Elefante T T G G A A C T
Mono A T G C C A T T
Unicornio A T G G C A C T

我想要一个这样的数据框:

    A   5 1 0 0 5 5 0 0
C 0 0 1 4 2 0 6 1
G 1 1 6 3 0 1 0 0
T 1 5 0 0 0 1 1 6

基本上,我想要的是逐列计算频繁出现的列并创建第二个 df,如我所示。

我想这样做是因为最后,我想获得一个共识字符串。应该是这样的 A T G C A A C T

谁能帮助我或给我一些建议?

最佳答案

尝试:

result = df.apply(pd.value_counts).fillna(0)

col1 col2 col3 col4 col5 col6 col7 col8
A 5.0 1.0 0.0 0.0 5.0 5.0 0.0 0.0
C 0.0 0.0 1.0 4.0 2.0 0.0 6.0 1.0
G 1.0 1.0 6.0 3.0 0.0 1.0 0.0 0.0
T 1.0 5.0 0.0 0.0 0.0 1.0 1.0 6.0

关于python - 计算 pandas DataFrame 中值的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59176526/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com