gpt4 book ai didi

xpath - 导入IO-使用XPath显示 "more"内容

转载 作者:行者123 更新时间:2023-12-03 15:55:18 25 4
gpt4 key购买 nike

我完全被这个难住了,并向我们寻求帮助!

我正在使用 Import.io 爬虫从 TripAdvisor 中提取评论。但是,当我训练爬虫时,“更多”按钮处于非事件状态。

这是页面示例:[ http://www.tripadvisor.co.uk/Hotel_Review-g295424-d306662-Reviews-Hilton_Dubai_Jumeirah_Resort-Dubai_Emirate_of_Dubai.html#REVIEWS][1]

这里是完整的评论 Xpath://*[@id="UR288083139"]/div[2]/div/div[3]

然后到“更多”按钮://*[@id="review_288083139"]/div[1]/div[2]/div/div/div[3]/p/span

是否可以使用 Xpath,以便将完整的评论包含在 Import.io 中?

最佳答案

执行此操作的一种方法是使用爬虫,然后使用提取器。这会将流程分为两部分。

  1. 创建一个您要训练的抓取工具,以捕获页面上每条评论的链接。确保为该列选择链接

    Sample review from the website

  2. 创建一个提取器以从您从爬虫获得的链接中捕获完整评论。

  3. 瞧!您获得了所有评论!

注意:如果您已经拥有需要评论的页面的所有链接,最好制作一个 Extractor 而不是 Crawler。这样,您可以将 API 链接到其他提取器。如果您不知道所有链接,则只需要一个爬虫。

希望这对您有所帮助!

关于xpath - 导入IO-使用XPath显示 "more"内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31386888/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com