gpt4 book ai didi

python - 在列名python中的某个位置保留字符串

转载 作者:行者123 更新时间:2023-12-04 09:06:31 33 4
gpt4 key购买 nike

我正在尝试在 kaggle 上预处理数据集:https://www.kaggle.com/sinaasappel/a-heat-map-divides-patients-into-3-groups .但是,在表 1 中,列名类似于:

'C8-A131.01TCGA', 'AO-A12B.01TCGA', 'BH-A18Q.02TCGA', 'C8-A130.02TCGA',
'C8-A138.03TCGA'...
我想将此表与另一个表中的行合并,如下所示:
TCGA-A2-A0T2    TCGA-A2-A0CM    TCGA-BH-A18V    TCGA-BH-A18Q    TCGA-BH-A0E0 ...
所以我想清理表 1 中的列名,将其更改为类似:
'A131', 'A12B', 'A18Q', 'A130', 'A138'
那么我怎样才能做到这一点呢?提前致谢!

最佳答案

如果所有列的模式一致,您可以使用正则表达式提取 - 之间的值。和 . .

df = pd.DataFrame(columns = ['C8-A131.01TCGA', 'AO-A12B.01TCGA', 'BH-A18Q.02TCGA', 'C8-A130.02TCGA','C8-A138.03TCGA'])

df.columns = df.columns.str.extract('.*-(.*)\..*')[0]
你得到
A131    A12B    A18Q    A130    A138

关于python - 在列名python中的某个位置保留字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63431232/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com