gpt4 book ai didi

python - 从 pandas 数据框中删除句子长度超过特定字长的行

转载 作者:太空狗 更新时间:2023-10-29 22:24:11 25 4
gpt4 key购买 nike

我想从 pandas 数据框中删除行,其中包含长度大于所需长度的特定列的字符串。

例如:

输入框:

X    Y
0 Hi how are you.
1 An apple
2 glass of water
3 I like to watch movie

现在,假设我想从数据框中删除包含长度大于或等于 4 的单词字符串的行。

所需的输出帧必须是:

X    Y
1 An apple
2 glass of water

列“X”中值为 0,3 的行被删除,因为列 0 中的单词数分别为 4,列 3 中的单词数分别为 5。

最佳答案

首先按空格拆分值,按 Series.str.len 获取行数并通过反转条件检查 >=< Series.lt 对于 boolean indexing :

df = df[df['Y'].str.split().str.len().lt(4)]
#alternative with inverted mask by ~
#df = df[~df['Y'].str.split().str.len().ge(4)]
print (df)
X Y
1 1 An apple
2 2 glass of water

关于python - 从 pandas 数据框中删除句子长度超过特定字长的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56563681/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com