作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用rvest
解析网站。我正在用这些不间断的小空间撞墙。如何删除解析的html文档中
元素创建的空白?
library("rvest")
library("stringr")
minimal <- html("<!doctype html><title>blah</title> <p> foo")
bodytext <- minimal %>%
html_node("body") %>%
html_text
bodytext
[1] " foo"
str_trim(bodytext)
gsub(pattern = " ", "", bodytext)
最佳答案
jdharrison回答:
gsub("\\W", "", bodytext)
gsub("[[:space:]]", "", bodytext)
Space characters: tab, newline, vertical tab, form feed, carriage return, space and possibly other locale-dependent characters
。它是其他隐式正则表达式类的一种非常易读的替代方法。
关于r - 解析包含html的HTML(不间断空格),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27237233/
我是一名优秀的程序员,十分优秀!