gpt4 book ai didi

r - 使用 R 中的 RegEx 以 Mon、DD、YYYY 格式解析日期

转载 作者:行者123 更新时间:2023-12-04 17:17:38 25 4
gpt4 key购买 nike

我试图从一串文本中解析一个日期。我假设最好的方法是正则表达式,但我还没有找到一个有效的解决方案。

首先,我使用 CSS 选择器从网站上获取日期。

date <-html_nodes(x=doc, css=".middleheadline+ .topnewsbar b") %>% html_text()

这产生:
[1] "\r\n        Washington,\r\n        Jan 5, 2011"

我想从此字符串中提取日期本身(此处为 2011 年 1 月 5 日)。注意:月份可以是任何月份,日期可以是任何日期,年份可以是 2011-2015 年之间的任何内容,所以我试图找到一个通常可以解析 Mon D[D] 中日期的表达式, YYYY 格式。

这是一种尝试:
date <-str_extract_all(string=date, pattern='[A-Z][a-z]{3,4} ([0-9]{1,2}), [0-9]{4}')

这会产生 character(0)
还有一个:
grep("[A-Z][a-z]{3,4} ([0-9]{1,2}), [0-9]{4}", date, value=TRUE)

也产生 character(0)
有小费吗?

最佳答案

您也可以试试 strsplit() .有时我更喜欢它而不是令人 NumPy 的正则表达式。

test <- c("\r\n        Washington,\r\n        Jan 5, 2011",
"\r\n Boston,\r\n Mar 15, 2015")

vapply(strsplit(test, ".*\n\\s+"), "[", "", 2)
# [1] "Jan 5, 2011" "Mar 15, 2015"

as.Date(vapply(strsplit(test, ".*\n\\s+"), "[", "", 2), "%b %d, %Y")
# [1] "2011-01-05" "2015-03-15"

关于r - 使用 R 中的 RegEx 以 Mon、DD、YYYY 格式解析日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31837142/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com