- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 Chrome 中的 RSelenium 从本地在线报纸上抓取或获取 Disqus 评论的文本,但我发现这对我的能力来说有点困难。我搜索了很多地方,但没有找到正确的信息,或者我使用了错误的搜索词(很可能)。
到目前为止,我已经设法从页面中获取“正常”的 html,但无法确定正确的类、css 选择器或 id 来获取 Disqus 评论。我也试过 Selectorgadget 但这只指向 #dsq-app2
它一次选择整个 Disqus 区域,不允许选择该区域的较小部分。我使用 elems <- mybrowser$findElement(using = "id", "dsq-app2")
对 RSelenium 进行了同样的尝试“环境”存储在 elems
中.然后我试图在 elems
中找到子元素但一无所获。
通过开发人员工具查看页面,我可以看到有趣的内容在名为 #dsq-app2
的 iframe 中。并设法通过 elems$getPageSource()
提取了所有来源使用 elems$switchToFrame("dsq-app2")
切换到框架后.这会将所有 html 输出为一个大的“脏” block ,并且没有搜索 <p>
中保存的所需内容。标签和其他感兴趣的元素,例如 data-role="username"
中的海报用户名和其他人,我似乎没有找到正确的前进方向。
我也尝试过使用给出的建议 here但是 Disqus 的设置有点不同。我正在尝试的页面之一是 this在名为 conversation
的部分中包含大部分评论区域和大量其他 ID,例如 posts
和带有 id=post-list
的无序列表最终带有我需要抓取的评论。
我们非常欢迎任何想法或帮助提示,并表示感谢。
最佳答案
经过大量的测试和实验,我成功了。我不知道它是否是最干净或最漂亮的解决方案,但它确实有效。希望其他人会发现它有用。基本上我所做的就是找到只指向评论的 url。这是在“dsq-app2”iframe
中找到的,是一个名为src
的属性
。起初我也切换到 iframe,但发现没有它也能工作。
remDr$navigate("toTheRequiredPage")
elemsource <- remDr$findElement(using = "id", value = "dsq-app2")
src <- elemsource$getElementAttribute("src") # find the src attribute within the iframe`
remDr$navigate(src[[1]]) # navigate to the src url
# find the posts from the new page
elem <- remDr$findElement(using = "id", value = "posts")
elem.posts <- elem$findChildElements(using = "id", value = "post-list")
elem.msgs <- elem.posts[[1]]$findChildElements(using = "class name", value = "post-message")
length(elem.msgs)
msgtext <- elem.msgs[[1]]$getElementText() # find first post's text
msgtext # print message
更新:我发现如果我使用 remDr$switchToFrame("dsq-app2")
我不需要像我上面解释的那样使用 src
url .所以实际上有两种抓取方式;
switchToFrame("nameOfFrame")
或src
URL希望这能让它更清楚。
关于html - 用于 Disqus 评论的 RSelenium 抓取,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38315485/
我正在使用评论系统,现在,我想重写 url 评论的片段并附加一个符号#,我想将页面部分移动到评论列表,正好是最后一个评论用户,带有 username 我在发表评论时使用 next 重定向用户: {
这个问题在这里已经有了答案: "Rate This App"-link in Google Play store app on the phone (21 个回答) 关闭2年前。 有没有一种方法可以要
长期潜伏者第一次海报... 我们正在使用 Facebook 的 API 将其集成到我们的网络应用程序中,并且我们能够通过 {page-id}/ratings 部分中的 {open_graph_stor
我正在尝试让 Visual Studio 2012 自动格式化我的评论 block ,就像它对我的 C# block 所做的那样。我希望我的评论看起来像这样: /* * Here is my C#
在 MySQl 中创建表时对每个字段进行注释是否会影响性能?我正在处理一个包含 1000 多个表的数据库,几乎每个表中的每个字段都有注释。我只是想知道这是否会以任何方式影响 MySQL 的性能? 最佳
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
这个问题在这里已经有了答案: SQL select only rows with max value on a column [duplicate] (27 个答案) 关闭 5 年前。 我这里有 2
如何在评论中正确编写 --> 或 -->? 我正在维护一个包含许多小程序代码条目的大型 html 文件。说: a --> b. 我在 HTML 中将其编码为 -->: a --> b. 但是,我
这是一个简单的问题。有没有办法允许用户直接在我的应用程序中输入评论和/或评级,并将这些数据发回 Android Market?如果是这样,如果我使用 EditText View 允许用户输入,代码会是
注释是否表示代码中带有//或/* */的注释? 最佳答案 不,注释不是评论。使用语法 @Annotation 将注释添加到字段、类或方法。最著名的注解之一是@Override,用于表示方法正在覆盖父类
我有一个包含两个模型的 Django 应用程序:第一个是 django.contrib.auth.User,第二个是我创建的 Product。 我会为每个产品添加评论,因此每个注册用户都可以为每个产品
有没有办法评论多行......其中已经有一些评论? 即 ... Hello world! Multi-line comment end --> 看来连
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: obj.nil? vs. obj == nil 现在通过 ruby koans 工作,发现这个评论嵌入在
这是一个基本问题 .gemrc 文件中是否允许注释? 如果是,你会怎么做? 我这里查了没用 docs.rubygems.org/read/chapter/11 最佳答案 文档说:The config
有没有办法在 SASS 中添加 sass-only 注释?你知道,所以输出 .css 文件没有那些注释 例如, /* global variables */ $mainColor: #666; /*
我想搜索在任何媒体上发布的评论中的任何特定关键字或几个关键字的组合。我的要求是在 API 的帮助下获取包含该关键字的评论。我浏览了 Instagram API 的文档,发现只能通过哈希标签进行搜索,而
在 WordPress 中,您可以在页面加载之前执行以下操作来编辑文章的内容: add_filter('the_content', 'edit_content'); function edit_con
在指示要合并的内容时, checkin 合并的最佳方法是什么?我已经说过 10 个变更集我正在从我的主分支合并到一个发布分支。每一个都包含我在 checkin 主分支时写的详细注释。现在,当我合并时,
我知道如何查询常规网站的社交参与度计数。可以使用Facebook图形浏览器(https://developers.facebook.com/tools/explorer/)或throug api轻松实
我正在尝试从 YouTube 视频中获得特定评论。例如,我想从 YouTube 视频的第 34 条评论中获取详细信息。有谁知道在不阅读所有评论列表的情况下我该怎么做? 或者,如果没有任何解决方案可以仅
我是一名优秀的程序员,十分优秀!