- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在 HtmlUnit 中寻找一种干净/简单的方法来以特定语言从服务器请求网页。
为此,我一直在尝试为他们的主页请求“bankofamerica.com”,而不是英语。
这是我到目前为止所做的:
我试图在 Http 请求中将“Accept-Language” header 设置为“es”。我这样做使用:
myWebClient.addRequestHeader("Accept-Language" , "es");
它没有用。然后我使用以下代码创建了一个网络请求:
URL myUrl = new URL("https://www.bankofamerica.com/");
WebRequest myRequest = new WebRequest(myUrl);
myRequest.setAdditionalHeader("Accept-Language", "es");
HtmlPage aPage = myWebClient.getPage(myRequest);
因为这也失败了,所以我打印了这个 url 的请求对象,以检查是否设置了这些 header 。
[<url="https://www.bankofamerica.com/", GET, EncodingType[name=application/x-www-form-urlencoded], [], {Accept-Language=es, Accept-Encoding=gzip, deflate, Accept=*/*}, null>]
所以服务器被请求一个西类牙语页面,但作为响应它发送英文主页(响应 header 的 Content-Language 值设置为 en-US)
我确实找到了一个用西类牙语检索 BOA 页面的技巧。我访问了此页面并使用 chrome 开发人员工具从请求中获取 cookie 值 header 。我使用此值执行以下操作:
myRequest.setAdditionalHeader("Cookie", "TLTSID= ........._LOCALE_COOKIE=es-US; CONTEXT=es_US; INTL_LANG=es_US; LANG_COOKIE=es_US; hp_pf_anon=anon=((ct=+||st=+||fn=+||zc=+||lang=es_US));..........1870903; throttle_value=43");
我猜答案就在这里。
这是我的下一个问题。如果我正在编写一个脚本来检索 100 个不同的西类牙语网站(即假设它们都有西类牙语的页面)。 HtmlUnit 中是否有一种干净的方法来完成此任务。
(如果 cookie 确实是一种解决方案,那么要在 htmlunit 中创建它们,您需要指定域名。然后必须为 100 个站点中的每一个创建 cookie。据我所知,在 HtmlUnit 中没有办法做类似的事情:
Cookie langCookie = new Cookie("所有域","LANG_COOKIE","es_US");myWebClient.getCookieManager().addCookie(langCookie);)
注意:我正在使用 HtmlUnit 2.12 并在网络客户端中设置 BrowserVersion.CHROME
谢谢。
最佳答案
关于您的第一个问题,如您所说,以特定语言请求网页的清晰/简单(/仅?)方式是将 HTTP Accept-Language
请求 header 设置为语言环境(s) 你想要的。就是这样。
现在,您请求特定语言的页面并不意味着您实际上会获得该语言的页面。服务器必须设置为处理该 HTTP header 并做出相应响应。即使网站的整个部分都是西类牙语,也不意味着该网站正在响应 HTTP header 。
一个明显的例子就是您提供的页面。我对其进行了快速测试,发现它显然没有响应我设置的 Accept-Language
(即 es
)。使用 es
点击主页会得到英文结果。但是,该页面有一个链接,说明 En Español
这意味着 In Spanish
页面确实切换到西类牙语,您将被重定向到 https://www.bankofamerica .com?request_locale=es_US
。
因此您可能会认为页面通过请求参数处理语言环境。然而,情况并非(仅)如此。因为如果您随后再次打开主页(没有区域设置参数),您将再次看到西类牙语版本。这显然证明它们存储在其他地方,很可能在 session 中,这很可能由 cookie 处理。
这可以通过打开私有(private) session 或清除 cookie 并确认此行为(我刚刚这样做)来轻松确认。
我认为这解释了以西类牙语存在的网页却以英语获取的神秘之处。 (请注意,大多数银行网页如何不符合基本标准,例如响应简单的 HTTP 请求……而他们正在处理我们的钱!)
关于你的第二个问题,这就像问永远不生病的秘诀是什么?。它只是不取决于你。另请注意,您的第一个问题使用的是请求,而您的第二个问题使用的是检索。我想现在应该很清楚了,您只能 100% 确定您请求的内容,而不是您检索的内容。
关于手动设置 cookie 中的值,这在技术上是可行的。但是,这就像在 get 请求中添加另一个参数:http://domain.com?login=yes
。该参数只有在服务器需要时才会被服务器处理。否则,它将被忽略。这就是您的 cookie 中的值会发生的情况。
总结:有标准可循。您可以尝试使用它们,但如果另一侧没有使用它们,那么您将无法获得预期的结果。您最好的选择:尽力而为并遵循标准。
关于java - HtmlUnit:以特定语言从服务器请求网站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19413917/
至少在某些 ML 系列语言中,您可以定义可以执行模式匹配的记录,例如http://learnyouahaskell.com/making-our-own-types-and-typeclasses -
这可能是其他人已经看到的一个问题,但我正在尝试寻找一种专为(或支持)并发编程而设计的语言,该语言可以在 .net 平台上运行。 我一直在 erlang 中进行辅助开发,以了解该语言,并且喜欢建立一个稳
As it currently stands, this question is not a good fit for our Q&A format. We expect answers to be
我正在寻找一种进程间通信工具,可以在相同或不同系统上运行的语言和/或环境之间使用。例如,它应该允许在 Java、C# 和/或 C++ 组件之间发送信号,并且还应该支持某种排队机制。唯一明显与环境和语言
我有一些以不同语言返回的文本。现在,客户端返回的文本格式为(en-us,又名美国英语): Stuff here to keep. -- Delete Here -- all of this below
问题:我希望在 R 中找到类似 findInterval 的函数,它为输入提供一个标量和一个表示区间起点的向量,并返回标量落入的区间的索引。例如在 R 中: findInterval(x = 2.6,
我是安卓新手。我正在尝试进行简单的登录 Activity ,但当我单击“登录”按钮时出现运行时错误。我认为我没有正确获取数据。我已经检查过,SQLite 中有一个与该 PK 相对应的数据。 日志猫。
大家好,感谢您帮助我。 我用 C# 制作了这个计算器,但遇到了一个问题。 当我添加像 5+5+5 这样的东西时,它给了我正确的结果,但是当我想减去两个以上的数字并且还想除或乘以两个以上的数字时,我没有
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 4 年前。 Improve th
这就是我所拥有的 #include #include void print(int a[], int size); void sort (int a[], int size); v
你好,我正在寻找我哪里做错了? #include #include int main(int argc, char *argv[]) { int account_on_the_ban
嘿,当我开始向数组输入数据时,我的代码崩溃了。该程序应该将数字读入数组,然后将新数字插入数组中,最后按升序排列所有内容。我不确定它出了什么问题。有人有建议吗? 这是我的代码 #include #in
我已经盯着这个问题好几个星期了,但我一无所获!它不起作用,我知道那么多,但我不知道为什么或出了什么问题。我确实知道开发人员针对我突出显示的行吐出了“错误:预期表达式”,但这实际上只是冰山一角。如果有人
我正在编写一个点对点聊天程序。在此程序中,客户端和服务器功能写入一个唯一的文件中。首先我想问一下我程序中的机制是否正确? I fork() two processes, one for client
基本上我需要找到一种方法来发现段落是否以句点 (.) 结束。 此时我已经可以计算给定文本的段落数,但我没有想出任何东西来检查它是否在句点内结束。 任何帮助都会帮助我,谢谢 char ch; FI
我的函数 save_words 接收 Armazena 和大小。 Armazena 是一个包含段落的动态数组,size 是数组的大小。在这个函数中,我想将单词放入其他称为单词的动态数组中。当我运行它时
我有一个结构 struct Human { char *name; struct location *location; int
我正在尝试缩进以下代码的字符串输出,但由于某种原因,我的变量不断从文件中提取,并且具有不同长度的噪声或空间(我不确定)。 这是我的代码: #include #include int main (v
我想让用户选择一个选项。所以我声明了一个名为 Choice 的变量,我希望它输入一个只能是 'M' 的 char 、'C'、'O' 或 'P'。 这是我的代码: char Choice; printf
我正在寻找一种解决方案,将定义和变量的值连接到数组中。我已经尝试过像这样使用 memcpy 但它不起作用: #define ADDRESS {0x00, 0x00, 0x00, 0x00, 0x0
我是一名优秀的程序员,十分优秀!