- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
在 TripAdvisor.com
景点页面上,景点网站的链接似乎以某种方式加密。这是一个例子:
<span class="taLnk hvrIE6" onclick="ta.trackEventOnPage('AttractionContactInfo',
'Website', 1755031, 1); ta.util.cookie.setPIDCookie(15190);
ta.call('ta.util.link.targetBlank', event, this
{'aHref':'LqMWJQiMnYQQoqnQQxGEcQQoqnQQbIIEJnISiCQQoqnQQeVsSVuWJQzZYUWJQpEcYGII26XombQQoqnQQQQoqnqgoqnQQQQoqnQQQQoqnQQQQoqnqgoqnQQQQoqnQQEVMIGVJIEV9pCyTptGiuQQoqnQQQQoqnxioqnQQQQoqnQQniaWJQzhY3mJnJUUJXomoAvoJJB', 'isAsdf':true})">
Website
</span>
这个链接是如何建立的,这样做的原因是什么?
最佳答案
aHref 值是一个加密的 URL,可以使用 TripAdvisor asdf() Javascript 函数对其进行解密。例如,使用 Firefox 中的 Javascript 控制台,在访问 www.tripadvisor.com 时键入以下内容:
console.log(asdf('加密后的网址'));
一个例子:
console.log(asdf('LqMWJQzZYUWJQpEcYGII26XombQQoqnQQQQoqnqgoqnQQQQoqnQQQQoqnQQQQoqnqgoqnQQQQoqnQQuuuQQoqnQQQQoqnxioqnQQQQoqnQQEitVuiiMqxQQoqnQQQQoqnxioqnQQQQoqnQQniaQQoqnQQQQoqnqgoqnQQQQoqnQQVCQQoqnQQQQoqnqgoqnQQQQoqnQQIGVQQoqnQQQQoqnqHoqnQQQQoqnQQnJEcgcVQQoqnQQQQoqnqHoqnQQQQoqnQQCVuQQoqnQQQQoqnqHoqnQQQQoqnQQgiE9QQoqnQQQQoqnqgoqnQQQQoqnQQMSCSCyQQoqnQQQQoqnqgoqnQQQQoqnQQHVaVcaJCtQQoqnQQQQoqnqHoqnQQQQoqnQQHJEWJQzhYUMo3JKHkmKnVmJVdUB'));
给出以下内容(附加到 http://tripadvisor.com ):
/ShowUrl-a_partnerKey.1-a_url.http%253A__5F____5F__2F__5F____5F____5F____5F__2F__5F____5F__www__5F____5F__2E__5F____5F__rosewoodhotels__5F____5F__2E__5F____5F__com__5F____5F__2F__5F____5F__en__5F____5F__2F__5F____5F__the__5F____5F__2D__5F____5F__carlyle__5F____5F__2D__5F____5F__new__5F____5F__2D__5F____5F__york__5F____5F__2F__5F____5F__dining__5F____5F__2F__5F____5F__bemelmans__5F____5F__2D__5F____5F__bar-a_urlKey.1d56a0b730ce3ae41.html
TripAdvisor asdf()函数的来源:
function asdf(d) {
var h = {
"": ["&", "=", "p", "6", "?", "H", "%", "B", ".com", "k", "9", ".html", "n", "M", "r", "www.", "h", "b", "t", "a", "0", "/", "d", "O", "j", "http://", "_", "L", "i", "f", "1", "e", "-", "2", ".", "N", "m", "A", "l", "4", "R", "C", "y", "S", "o", "+", "7", "I", "3", "c", "5", "u", 0, "T", "v", "s", "w", "8", "P", 0, "g", 0],
q: [0, "__3F__", 0, "Photos", 0, "https://", ".edu", "*", "Y", ">", 0, 0, 0, 0, 0, 0, "`", "__2D__", "X", "<", "slot", 0, "ShowUrl", "Owners", 0, "[", "q", 0, "MemberProfile", 0, "ShowUserReviews", '"', "Hotel", 0, 0, "Expedia", "Vacation", "Discount", 0, "UserReview", "Thumbnail", 0, "__2F__", "Inspiration", "V", "Map", ":", "@", 0, "F", "help", 0, 0, "Rental", 0, "Picture", 0, 0, 0, "hotels", 0, "ftp://"],
x: [0, 0, "J", 0, 0, "Z", 0, 0, 0, ";", 0, "Text", 0, "(", "x", "GenericAds", "U", 0, "careers", 0, 0, 0, "D", 0, "members", "Search", 0, 0, 0, "Post", 0, 0, 0, "Q", 0, "$", 0, "K", 0, "W", 0, "Reviews", 0, ",", "__2E__", 0, 0, 0, 0, 0, 0, 0, "{", "}", 0, "Cheap", ")", 0, 0, 0, "#", ".org"],
z: [0, "Hotels", 0, 0, "Icon", 0, 0, 0, 0, ".net", 0, 0, "z", 0, 0, "pages", 0, "geo", 0, 0, 0, "cnt", "~", 0, 0, "]", "|", 0, "tripadvisor", "Images", "BookingBuddy", 0, "Commerce", 0, 0, "partnerKey", 0, "area", 0, "Deals", "from", "\\", 0, "urlKey", 0, "'", 0, "WeatherUnderground", 0, "MemberSign", "Maps", 0, "matchID", "Packages", "E", "Amenities", "Travel", ".htm", 0, "!", "^", "G"]
};
var b = "";
for (var a = 0; a < d.length; a++) {
var j = d.charAt(a);
var f = j;
if (h[j] && a + 1 < d.length) {
a++;
f += d.charAt(a)
} else {
j = ""
}
var g = getOffset(d.charCodeAt(a));
if (g < 0 || typeof h[j][g] == "String") {
b += f
} else {
b += h[j][g]
}
}
return b}
以及从asdf()引用的getOffset()函数的来源:
function getOffset(a) {
if (a >= 97 && a <= 122) {
return a - 61
}
if (a >= 65 && a <= 90) {
return a - 55
}
if (a >= 48 && a <= 71) {
return a - 48
}
return -1}
关于html - TripAdvisor 上可能加密的 "a href"链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19955778/
我是 python3 网络抓取的新手。我想抓取迪拜所有酒店的评论,但问题是我只能抓取我在 url 中描述的酒店评论。谁能告诉我如何在不隐式提供每家酒店的网址的情况下获得所有酒店评论? import r
我的目标是在我的应用程序中与其他排名系统一起显示 TripAdvisor 评分排名。请记住,我的应用程序是 B2B 应用程序,而不是 B2C。 即使阅读了开发人员文档,我仍然无法理解的是我最终应该要求
我正面临网络抓取问题。我打算在 tripadvisor 上收集一些评论。我想使用 rvest 并获得所有语言的评论。来自 this questions我知道一种可能的方法是在 url 的末尾使用 ?f
我们目前正在开展一个 NLP 项目,需要一个旨在从 tripadvisor.com 中提取的语料库。我们期望输出有两种类型:评论和该评论的评级。我的问题是: 有没有最适合此目的的抓取工具?一定要简单易
我有一个场景,我需要单击tripadvisor内的气泡评级小部件的第五个气泡。 HTML 代码是: 我正在尝试使用以下代码片段: Actions action = new Actions(dri
在网站的页脚中,我想包含社交小部件。 Facebook 一个工作得很好,Tripadvisor 有很多行代码,而且没有真正的风格,跳出我的页脚等。 我最终如何为未设置样式的小部件设置样式?如果我更改代
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭1
我一直在 BS4 中构建一个网络抓取工具,但遇到了困难。我正在使用 Trip Advisor 作为我将要追踪的其他数据的测试,但无法隔离“整个”评论的标签。这是一个例子: https://www.tr
刚刚接受了 TripAdvisor 的电话面试(没有成功)。 我得到了下面的代码并要求我实现 findBestTravelAlert(用 Java)。 给定一个 TravelAlert 对象列表,找到
我想获取我正在使用 TripAdvisor API 的特定酒店的评分和评论。 我得到了这个链接: api.tripadvisor.com/api/partner/2.0/location/**8957
我想获取我正在使用 TripAdvisor API 的特定酒店的评分和评论。 我得到了这个链接: api.tripadvisor.com/api/partner/2.0/location/**8957
我正在尝试将 Tripadvisor 小部件 (rave) 添加到通过 Ajax 加载的页面。这是小部件代码: Read 37 reviews of Bond
我正在使用 Python-Scrapy 来删除 tripadvisor 成员(member)页面的评论。这是我正在使用的网址:http://www.tripadvisor.com/members/sc
在 TripAdvisor.com 景点页面上,景点网站的链接似乎以某种方式加密。这是一个例子: Website 这个链接是如何建立的,这样做的原因是什么? 最佳答案 aHref 值是一个
嗨,我是 angularjs 新手。我想向我的 angularjs 应用程序添加一个 tripadvisor 小部件。小部件代码如下:
我想知道如何从 Trip Advisor Api 获取特定地点的所有评论。现在我的电话是 http://api.tripadvisor.com/api/partner/2.0/location/SOM
我正在尝试抓取特定 TripAdivsor 页面的所有图像,但在 Selenium 中使用 find_elements_by_class_name 函数时,它没有给我任何值。我很困惑,因为这是我想要迭
我正在尝试将 Tripadvisor 评分小部件添加到我的 React 网站(请参阅下面的代码)。目前,只有 Tripadvisor 日志正在加载,没有评级信息。我认为小部件中的脚本没有运行,我不确定
本周,我开始为一位经营旅游公司的家庭成员开发我的第一个 WordPress 网站,该成员有一个非常过时的网站,我决定从头开始构建该网站。 一切都很顺利,直到我决定将他的一些 TripAdvisor 小
来自 this页面,我想抓取列表“迈阿密的事件类型”(您可以在页面末尾附近找到它)。这是我到目前为止所拥有的: import requests from bs4 import BeautifulSou
我是一名优秀的程序员,十分优秀!