gpt4 book ai didi

删除字符串开头但不结尾的模式

转载 作者:行者123 更新时间:2023-12-02 08:09:43 27 4
gpt4 key购买 nike

我有一个学校列表,但其中一些是有排名的。我想删除学校的排名(在字符串的开头)。当学校排名时,它看起来像这样:

(3) Trinity

但是,有些学校的名字末尾有括号,例如:

Concordia (Minn.)

所以我不想删除位于字符串末尾的括号。

我不太确定该怎么做,但我假设我需要正则表达式。

获取我的数据:

library(dplyr)
library(rvest)
library(purrr)

page_num <- seq(4, 16, by = 1) %>%
paste("/", sep = "") %>%
{page_num[-10]}

site <- paste("http://www.uscho.com/scoreboard/division-iii
men/20172018/list-", page_num, sep = "")

get_opponent <- function(x) {

read_html(site[x]) %>%
html_nodes("td:nth-child(2)") %>%
html_text()

}

opponents <- map(seq(1, length(page_num)), get_opponent) %>%
unlist() %>%
tibble()

opponents

最佳答案

我们可以在这里使用sub,模式如下^

^\s*\(\d+\)\s*(.*)

这会匹配前导排名,前后可能有空格,然后匹配并捕获字符串的其余部分。然后用余数替换该字符串。

x <- "(3) Trinity"
result <- sub("^\\s*\\(\\d+\\)\\s*(.*)", "\\1", x)
result

[1] "Trinity"

Demo

关于删除字符串开头但不结尾的模式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48392898/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com