gpt4 book ai didi

从字符串中删除 url

转载 作者:行者123 更新时间:2023-12-02 07:36:54 27 4
gpt4 key购买 nike

我有以下字符串,存储在对象 sentence 中:

sentence <- "aazdlubtirol: RT @tradeDayTrades: sister articles \"$AAPL Dancing in a Burning Room\" January 2013  http://t.co/tkuCRfLy  \" $AAPL vs $AAPL \"  August 2011 http://t.co/863HkVjn"

我正在尝试使用 gsub 删除以 http 开头的网址:

sentence <- gsub('http.*','',sentence)

但是,它会替换 http 之后的所有内容:

aazdlubtirol: RT @tradeDayTrades: sister articles \"$AAPL Dancing in a Burning Room\" January 2013

我想要的是:

aazdlubtirol: RT @tradeDayTrades: sister articles \"$AAPL Dancing in a Burning Room\" January 2013 \" $AAPL vs $AAPL \" August 2011

我正在尝试清理网址,因此如果字符串包含 http我想删除网址。我找到了一些解决方案,但它们对我没有帮助。

最佳答案

向您的替换组添加一个空间:

gsub('http.* *', '', sentence)

或者使用 \\s 这是空格的正则表达式:

gsub('http.*\\s*', '', sentence)

根据评论,.* 将匹配任何内容,并且正则表达式是贪婪的。相反,我们应该匹配一个或多个非空白字符任意次数,后跟零个或多个空格:

gsub('http\\S+\\s*', '', sentence)

关于从字符串中删除 url,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21589254/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com