gpt4 book ai didi

python - 如何仅保留数据帧上具有特定文本的 'cells'?

转载 作者:行者123 更新时间:2023-12-04 00:57:10 25 4
gpt4 key购买 nike

我很想知道是否可以只保留数据框中具有特定文本的“单元格”,例如,如果我有以下数据框:

import pandas as pd
import numpy as np


df = pd.DataFrame(np.array([['12hello2', '12hey2', 'hello', '12hey2', '1hello'], ['12hey2', '12hey2', 'hello', '1hello', '1hello'], ['12hey2', '12hey2', 'hello', '1hello', '1hello']]),
columns=['a', 'b', 'c','d','e'])

除了包含字符串“hello”的“单元格”之外,我如何删除所有内容?我知道如何为特定列或特定行执行此操作,但无法弄清楚如何为两者执行此操作,所以我只剩下字符串中包含“hello”的实例。

最佳答案

我能想到的最简单的方法是使用 apply 按列过滤,然后使用 where 屏蔽:

df.where(df.apply(lambda x: x.str.contains('hello')))

输出:

          a    b      c       d       e
0 12hello2 NaN hello NaN 1hello
1 NaN NaN hello 1hello 1hello
2 NaN NaN hello 1hello 1hello

关于python - 如何仅保留数据帧上具有特定文本的 'cells'?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61466033/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com