gpt4 book ai didi

r - 在R的字符串中间或结尾提取数字

转载 作者:行者123 更新时间:2023-12-02 05:24:30 25 4
gpt4 key购买 nike

我有一个字符串 vector 。我想在“#Stalls:”之后提取一个数字,这些数字位于字符串的中间或结尾。

x <- c("1345 W. Pacific Coast Highway<br/>Wilmington 90710<br/><br/>County: Los Angeles<br/>Date Updated: 6/25/2013<br/>Latitude:-118.28079400<br/>Longitude:33.79077900<br/># of Stalls: 244<br/>Cost: Free", "20601 La Puente Ave<br/>Walnut 91789<br/>County: Los Angeles<br/>Date Updated: 6/18/2007<br/>Latitude: -117.859972<br/>Longitude: 34.017513<br/>Owner: Church<br/>Operator: Caltrans<br/># of Stalls: 40")

这是我的审判,但还不够。我感谢您的帮助。
gsub(".*\\# of Stalls: ", "", x) 

最佳答案

由于是HTML,因此您可以使用rvest或其他HTML解析器首先提取所需的节点,这使得提取数字变得微不足道。对于此类工作,XPath选择器和函数比CSS提供了更多的灵活性。

library(rvest)

x %>% paste(collapse = '<br/>') %>%
read_html() %>%
html_nodes(xpath = '//text()[contains(., "# of Stalls:")]') %>%
html_text() %>%
readr::parse_number()
#> [1] 244 40

关于r - 在R的字符串中间或结尾提取数字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43309054/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com