- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想直接将与关键字相关的数据下载到 R 中或从 R 中下载。我知道 RCurl 很可能是可行的方法,但我不确定如何继续执行该任务。也许这里有人可以让我走上正轨?
附言。随着答案的涌入,我可能会稍微编辑这个问题,因为我对如何使用 R 下载 Adwords 数据有一些想法;然而,这些想法还不清楚,任何答案都可能会使它们更加清晰。
非常感谢。
编辑:我的尝试
以下是我到目前为止的尝试。
1. 在登录 URL 上应用 getURL
以识别电子邮件和密码字段的 ids
require(RCurl)
loginURL<- "https://accounts.google.com/ServiceLogin?service=adwords"
ch<- getCurlHandle()
curlSetOpt(curl=ch,ssl.verifypeer=FALSE,cainfo=system.file("CurlSSL", "cacert.pem", package = "RCurl"),cookiejar="./cookies.txt",cookiefile="./cookies.txt",verbose=TRUE,header=TRUE,followlocation=TRUE,autoreferer=TRUE)
try1<- getURL(loginURL,curl=ch)
2. 我确定了重要字段(电子邮件和密码)的 id
是什么
<div class="email-div">
<label for="Email"><strong class="email-label">Email</strong></label>
<input type="email" spellcheck="false"
name="Email" id="Email" value=""
>
</div>
<div class="passwd-div">
<label for="Passwd"><strong class="passwd-label">Password</strong></label>
<input type="password" name="Passwd" id="Passwd"
3. 然后,我使用上述字段在 loginURL
上应用 postForm
函数以登录 Google Adwords
params<- list(
"Email"="myemail",
"Passwd"="mypassword",
"GALX"="3b6rR7Jvk30")
loggedIn<- postForm(loginURL,.params=params,curl=ch)
但是,我不知道如何验证我是否已成功登录。
另外,Google Adwords 用户界面中 Kyeword 规划工具的 URL 是:
https://adwords.google.com/ko/KeywordPlanner/Home?__c=XXXXXXXXXX&__u=XXXXXXXXXX&__o=cues
其中 c= 反射(reflect)了 客户 id
,u= 反射(reflect)了 用户 id
。考虑到这一点,我想做的是使用我的浏览器登录,将上面显示的 URL 粘贴到 R 中,然后尝试找出与我相关的字段的 ID,例如关键字规划器工具中的 关键字文本框
,我可以从 R 向其发送关键字。
但是当我尝试在上述网站上应用 getURL
时,我没有获得所需/预期的 xml 标签
或 键值对
.相反:
<html><head><noscript><meta http-equiv="refresh" content="0; URL=https://adwords.google.com/select/interstitial_short_js.html"></noscript></head><body><script type="text/javascript" language="javascript">var jsRedirect = true;var url = "/um/StartNewLogin?dst=/ko/KeywordPlanner/Home?__c%3D7857647860%26__u%3D4575929980%26__o%3Dcues";
if (self.document.location.hash) {url = url + ((url.indexOf('?') == -1)? '?' : '&') + "frag=" + self.document.location.hash.substring(1); }
window.location.assign(url);
</script> </body> </html>
这让我觉得我可能在这里处理 Javascript
或 AJAX
。那么,如何使用 RCurl
从 Javascript
或 AJAX
中提取数据,这是要问的正确问题吗?
感谢并为冗长的编辑道歉。
最佳答案
你看到我们的RAdwords了吗?同时打包?
它为使用 Adwords API 的 R 提供了身份验证过程,并提供了一个接口(interface)以将数据从 Adwords API 直接加载到 R。
加载关键字数据的示例代码:
#install package from CRAN
install.packages('RAdwords')
#load package
library(RAdwords)
#start authentication process
google_auth <- doAuth()
#build statement object
body <- statement(select=c('AccountDescriptiveName','Date', 'CampaignName', 'AdGroupName','KeywordText', 'KeywordMatchType', 'Clicks', 'Cost'),
report="KEYWORDS_PERFORMANCE_REPORT",
start="20140320",
end="20140321")
#download data as data frame
data <- getData(clientCustomerId='xxx-xxx-xxxx',
google_auth = google_auth,
statement=body,
transformation = T)
#all available report types
reports()
#all available metrics of specific report type
metrics("KEYWORDS_PERFORMANCE_REPORT")
关于用于 Google Adwords 的 RCurl,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20777430/
我尝试了多种方法来安装 RCurl,但无济于事。我在我的输出中得到了这个: * installing *source* package 'RCurl' ... ** package 'RCur
我在获取 RCurl 函数 getURL 以访问使用自签名证书的服务器上的 HTTPS URL 时遇到问题。我在 Mac OS X 10.9.2 上运行 R 3.0.2。 我已阅读FAQ和 curl
我正在尝试定期列出 MODIS 全局蒸散项目 (MOD16) 的 FTP 服务器上托管的文件。 ## required package library(RCurl) ## ftp server ch_
我想使用 RCurl 作为礼貌的网络爬虫从网站下载数据。显然我需要科学研究的数据。虽然我有权通过我的大学访问该网站的内容,但该网站的使用条款禁止使用网络爬虫。 我试图直接向网站管理员询问数据,但他们只
这些 Curl 文档:http://curl.haxx.se/docs/manpage.html#-d列出许多 bool 选项。 如何在 RCurl 的 postForm 调用中指定这些选项?例如,如
我有以下要求 library(RCurl) res=getURL("http://www.google.com/search?hl=en&lr=&ie=ISO-8859-1&q=RCurl&btnG=
我想使用RCurl登录网站并从网上抓取数据(不登录就看不到数据。) 我想在使用 RCurl 登录后将此(例如)“http://www.appannie.com/app/ios/instagram/ra
看起来我们在 RCurl 中遇到了错误。方法 getURL 似乎正在泄漏内存。这里给出了一个重现错误的简单测试用例: library(RCurl) handle<-getCurlHandle() ra
我最初询问 this question 关于使用 httr 包执行此任务,但我认为使用 httr 是不可能的。所以我重新编写了我的代码以使用 RCurl 代替 - 但我仍然被一些可能与 writefu
有没有办法在 R session 中查看 curl 选项的当前设置? 我的问题是我在代理后面,必须设置代理选项才能使连接正常工作,并且在调用 listMarts() 函数(来自 biomaRt 库,使
我正在尝试在 OS X 10.12.6 上安装 RCurl,但出现以下错误: Error: package or namespace load failed for ‘RCurl’ in dyn.lo
以下是一个脚本,用于重现我在使用执行并发请求的 RCurl 构建爬虫时所面临的问题。 目标是下载数千个网站的内容以进行统计分析。因此,解决方案应该扩展。 library(RCurl) library(
我在Kubuntu14.04上安装了新版本的RStudio(即0.99最新版本)。当尝试上传 Shiny 的应用程序时,我收到一条消息,显示“必须安装 RCurl 和其他几个软件包” - 此安装失败,
使用 R.exe 或 Rterm.exe,这提供了一个极好的进度表。 page=getURL(url="ftp.wcc.nrcs.usda.gov", noprogress=FALSE) 在 Rgui
相关问题: RCurl errors when fetching ssl endpoint R: Specify SSL version in Rcurl getURL statement 我正在查看
我正在尝试使用 Clearbit.com 的免费 Logo API ( https://logo.clearbit.com/:domain ) 下载一些公司 Logo 。 要试用该工具,只需粘贴 ht
感兴趣的 URL 是: http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/PTO/search
如何转换此命令: curl -v -u abcdefghij1234567890:X -H "Content-Type: application/json" -X GET 'https://domai
我想直接将与关键字相关的数据下载到 R 中或从 R 中下载。我知道 RCurl 很可能是可行的方法,但我不确定如何继续执行该任务。也许这里有人可以让我走上正轨? 附言。随着答案的涌入,我可能会稍微编辑
如何使用 RCurl(或 Curl,我可以将其调整为 R 包)登录到 mediawiki? 我只想解析一个页面,但我需要登录,否则我无法访问它。 最佳答案 Mediawiki API 有一个登录函数,
我是一名优秀的程序员,十分优秀!