Python 从 tripadvisor 抓取 'things to do'-6ren

Python 从 tripadvisor 抓取 'things to do'

转载作者：太空宇宙更新时间：2023-11-04 07:14:24

26

4

来自 this页面，我想抓取列表“迈阿密的事件类型”(您可以在页面末尾附近找到它)。这是我到目前为止所拥有的:

import requests
from bs4 import BeautifulSoup

# Define header to prevent errors
user_agent = "Mozilla/44.0.2 (Macintosh; Intel Mac OS X 10_10_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.109 Safari/9.0.2"

headers = {'User-Agent': user_agent}

new_url = "https://www.tripadvisor.com/Attractions-g34438-Activities-Miami_Florida.html"
# Get response from url
response = requests.get(new_url, headers = headers)
# Encode response for parsing
html = response.text.encode('utf-8')
# Soupify response
soup = BeautifulSoup(html, "lxml")

tag_elements = soup.findAll("a", {"class":"attractions-attraction-overview-main-Pill__pill--23S2Q"})

# Iterate over tag_elements and exctract strings
tags_list = []
for i in tag_elements:
    tags_list.append(i.string)

问题是，我从“Commonly Searched For in Miami' area of the page which below the "Types of Things..."部分页面。我也没有得到一些我需要的值，比如 “Traveler Resources (7)”、“Day Trips (7)” 等。这两个列表的类名“Things to do。 ..”和“常用搜索...”是相同的，我在 soup.findAll() 中使用类，我猜这可能是导致此问题的原因。这样做的正确方法是什么？我应该采取其他方法吗？

最佳答案

这在浏览器中非常简单:

filters = driver.execute_script("return [...document.querySelectorAll('.filterName a')].map(a => a.innerText)")

关于Python 从 tripadvisor 抓取 'things to do'，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53452863/

26

4

0

文章推荐： python - 在 Python 中查找列表中最长和最短的列表

文章推荐： java - 使用 java 从复杂的 XML 中读取值

c++ - "Thing thing;"和 "Thing thing = Thing();"之间有什么区别，我什么时候应该使用其中一个？
我不明白以下两个语句之间的区别: Thing thing; Thing thing = Thing(); 两者都创建了一个Thing对象，并把它放在变量thing中，对吧？如果是，两个问题: 1- 两
android-things - 未找到 Android Things 权限 com.google.android.things.permission.MANAGE_INPUT_DRIVERS
我将 RPi3 与 Android Things 0.5.1 一起使用。虽然我在我的 AndroidManifest.xml许可: 我得到了异常(exception): java.lang.Secu
SQL 语句 HAVING MAX(some+thing)=some+thing
我在使用 Microsoft Access 2003 时遇到问题，它提示以下声明: select cardnr from change where year(date)<2009 group by
android-things - Android Things OTA
如何使用预览版 2 更新我的 Android Things 预览版 1？是否有自动 OTA 可用，或者现在不可能，所以我必须刷新 SD 卡(来自我的 Raspberry Pi)？最佳答案编辑 1:
PHP : is it dynamich thing or any thing else
任何人都可以解释为什么这是真的 $a = Array('b' = > 'okokokok'); if ( isset( $a['b']['ok'] ) ) { echo $a['b
android-things - Android Things RPI3 相机挂起图像阅读器
无法找到如何从相机拍摄单张照片的方法。在使用图像阅读器并使用 TEMPLATE_STILL_CAPTURE 发送捕获请求时，应用程序只是停在这个位置，没有其他任何事情发生。尝试使用我的代码，认为问
rust - 无法将 `&Thing` 与 `Thing` 进行比较
我知道错误的含义，但我无法修复它。我正在使用 mockers 来测试我的工作，但在尝试验证提供给模拟特征函数的结构参数时遇到了困难。简化代码: #[cfg(test)] extern crate mo
java - 通过继承自 Thing 的属性查询 Thing 的子类
在官方 schema.org 文档中，我可以看到每个类都继承了 Thing 的属性。类，例如 Book类还有name , image等等(来自 Thing 的属性)。我的问题是，我可以获得例如 im
php - 如果 (!empty($thing)) 与 if($thing)
假设 $thing 可以是任何类型，这两个语句的执行是否相同？ if (!empty($thing)) { // do stuff } if ($thing) { // do stuf
c - c习语的名字—— `static void *thing = &thing;`
代码: static const void *const uniquePtr = &uniquePtr; …将在编译单元中提供一个唯一的void指针。以这种方式为喜欢将名称作为 void* 的 API
java - Android things : 1. 0.0 Issue : Superclass com. com.google.android.things.contrib.driver.button 的 google.android.things.pio.GpioCallback
我在github中有这段代码 https://github.com/neuberfran/sample-button-master 我有问题: java.lang.IncompatibleClassC
android-things - 如何从 GPIO、Android-things 读取模拟数据
试图从 gpio 读取模拟数据，但只看到一种将信号强度返回为 LOW 或 HIGH( bool 值)的方式。在文档和代码引用中找不到任何解决方案。现在甚至可能吗？最佳答案树莓派 3 没有 an
android-things - Android Things 产品推荐的 oem 分区大小是多少？
在使用 Android Things 控制台创建另一个 Android Things 产品时，我再次想知道要选择什么 oem 分区大小。此设置的信息是“必须在 32 到 512 MB 之间”，这是一个
android-things - Android Things : Set screen resolution
我在Raspberry Pi上安装了一个小屏幕，并根据屏幕的documentation: Write the image to a TF card and append the following l
android-things - 创建 Android Things 的自定义图像，包括我的自定义应用程序
我计划将 Raspberry PI 用于 Android Things 项目，我可以在其上闪烁默认图像 (androidthings_rpi3_devpreview_4_1.zip)。我已经安装了我的
android-things - Android Things 是否支持 RenderScript 计算？
我知道 Android Things 支持 NDK。我找不到以一种或另一种方式说明 Android Things 是否支持 RenderScript Compute 的引用。我的假设是否定的(因为并非
android-things - 如何在 Android Things OS 中重置默认应用程序？
昨天我开始了一个 Android Things 项目，我正在使用 Android Studio 测试该应用程序。为了使用 adb.exe 连接到设备，我使用了我在默认操作系统的应用程序(起始屏幕)上看
javascript - 当第一个 "things"返回之前总数未知时，在循环中批量运行大量异步 "thing"的优雅方法？
我正在解决的问题是在所有页面(问题、标签等)上调用 Stack Exchange API (1.1)。但事实上，这似乎也可能是一个普遍问题，所以我在这里发帖，而不是在 StackApps 上。因此，
language-agnostic - DoSomethingToThing(Thing n) vs Thing.DoSomething()
哪些因素决定哪种方法更合适？最佳答案我认为两者都有自己的位置。你不应该简单地使用 DoSomethingToThing(Thing n)只是因为你认为“函数式编程很好”。同样，您不应该简单地使用
javascript - 为什么 import { Thing } 有效但 import Thing 不起作用？
这个问题已经有答案了: using brackets with javascript import syntax (2 个回答) 已关闭 5 年前。我正在观看 Pluralsight 上的一些培训视

首页

博学

6Ren·AI

商城

Python 从 tripadvisor 抓取 'things to do'