gpt4 book ai didi

regex - 删除具有缺失值的数据框列中字符串后的所有内容

转载 作者:行者123 更新时间:2023-12-01 09:57:13 26 4
gpt4 key购买 nike

我有一个类似于下面摘录的数据框:

Observation Identifier   Value
Obs001 ABC_2001 54
Obs002 ABC_2002 -2
Obs003 1
Obs004 1
Obs005 Def_2001/05

我想将此数据框转换为一个数据框,其中 “_” 符号之后的字符串部分将被删除:如下图所示:

Observation Identifier_NoTime   Value
Obs001 ABC 54
Obs002 ABC -2
Obs003 1
Obs004 1
Obs005 Def

我尝试使用此处讨论的 strsplitgsubsub 进行试验,但不能强制这些建议起作用。我必须考虑以下事实:

  1. 列有缺失值,我想将它们留在原处
  2. 字符串“_”位于变量的不同位置
  3. 我还想保留数据框的其余部分

最佳答案

您可以尝试使用下面的 sub 命令从 _ 符号中删除所有非空格字符。

sub("_\\S*", "", string)

解释:

  • _ 匹配文字 _ 符号。
  • \S* 匹配零个或多个非空格字符。

这将从 _ 符号中删除所有字符,

sub("_.*", "", string)

解释:

  • _ 匹配文字 _ 符号。
  • .* 匹配任何字符零次或多次。

关于regex - 删除具有缺失值的数据框列中字符串后的所有内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26611922/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com