python - 在 BeautifulSoup 中处理无限滚动 UI-6ren

python - 在 BeautifulSoup 中处理无限滚动 UI

转载作者：行者123 更新时间：2023-12-01 06:32:48

25

4

我正在研究如何抓取 Linkedin 源代码( https://www.linkedin.com/mynetwork/invite-connect/connections/ )，但无限滚动似乎是不可能的。怎么处理呢？我不想使用 Selenium(想稍后实现为 Web 服务)。

import bs4
from bs4 import BeautifulSoup
import requests

def scraping(webpage):
    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
    response= requests.get(str(webpage), headers=headers)
    soup = BeautifulSoup(response.text,"html.parser")
    print(soup)

scraping('https://www.linkedin.com/mynetwork/invite-connect/connections')

最佳答案

BeautifulSoup 只能对您提供的 HTML 提供帮助；您需要让 LinkedIn 返回更多 HTML。该内容不在您拥有的 HTML 中，因此您必须获取它。浏览器可能正在运行 LinkedIn 的 javascript 来注意到您正在滚动，因此它需要获取更多内容并在页面中注入(inject)更多 HTML - 您需要以某种方式复制此内容获取。

坏消息:BeautifulSoup 不支持 API 或 javascript。您将需要另一个工具。

好消息:有这方面的工具!您当然可以使用 Selenium，这可能是解决此问题的最简单方法，因为它可以很好地复制浏览器环境来实现这些目的。

如果您绝对致力于不使用 Selenium，我建议您深入研究 LinkedIn 网站，看看是否可以找出哪些 javascript 负责获取更多数据，并复制它们发出的网络请求，以及然后自己解析该数据。

不过，对于大多数人来说，Selenium 将是正确的答案。

关于python - 在 BeautifulSoup 中处理无限滚动 UI，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59811401/

25

4

0

文章推荐： java - 检查前两位数字是否在 00 && 99 之间

文章推荐： java - 匹配 ":"之后包含的字符串的正则表达式

文章推荐： python - heapq 成员资格测试和替换

jquery-ui - Angular-UI 从 ui-date 中的日期减去一天
情况我想使用 ui-date 在我的应用程序中设置/编辑日期。我使用最新稳定版本的 Angular、Angular-UI、JQuery-UI 等。问题一旦使用日期选择器选择了日期，我的模型中的日期将
jquery-ui - 触发 jQuery UI 事件 : ui-selectable
编辑: jQuery UI 可选择小部件内置了一个回调，stop，我需要知道如何以编程方式触发此事件。 (措辞不佳)我已将事件监听器附加到 jQuery UI Selectable Widget 。如
How to use Tailwind UI (headless ui) components with Next JS server components?(如何将TailWind UI(Headless UI)组件与Next JS服务器组件配合使用？)
我正在尝试建立一个下一个JS与尾风用户界面提供的反应组件的网络应用程序。顺风用户界面是在幕后使用无头用户界面。。默认情况下，Next JS将构建服务器端组件，除非您在页面顶部添加“使用客户端”。不幸的
How to use Tailwind UI (headless ui) components with Next JS server components?(如何将TailWind UI(Headless UI)组件与Next JS服务器组件配合使用？)
我正在尝试建立一个下一个JS与尾风用户界面提供的反应组件的网络应用程序。顺风用户界面是在幕后使用无头用户界面。。默认情况下，Next JS将构建服务器端组件，除非您在页面顶部添加“使用客户端”。不幸的
jquery-ui - jQuery UI 主题冲突 : SlickGrid and jQuery UI Tabs
我正在尝试应用这个 SlickGrid 示例: http://mleibman.github.com/SlickGrid/examples/example4-model.html 到我自己的网络项目。
swagger-ui - 如何在 Swagger-ui SpringDoc open ui 上对模式进行排序
我想整理我的 Schemas为我的实体类生成，DTO 类位于 Springdoc ui . 我可以对 tags 进行排序和 operations通过以下配置 yml文件，但我的模式不是按排序顺序排列的
angular-ui-router - UI-ROUTER - 阻止 ui-sref 改变状态
有谁知道阻止 ui-sref 重新加载状态的方法吗？我无法通过“$stateChangeStart”事件执行此操作，因为 ui-sref 仅更改参数而不更改状态名称。我的左边是书单，左边是书的详细
jquery-ui - 模态 ui 对话框内的 jquery UI 自动完成 - 建议未显示？
我正在 jquery ui 对话框中使用 jquery ui 自动完成小部件。当我输入搜索文本时，文本框缩进(ui-autocomplet-loading)但不显示任何建议。 var availabl
kendo-ui - Kendo UI MVVM 与 Kendo UI 拖放
我正在尝试将 Kendo UI MVVM 框架与 Kendo UI 拖放机制结合使用；但我很难找到如何将数据从 draggable 对象中删除。我的代码是这样的...... var viewMode
kendo-ui - Kendo UI Core 与 Kendo UI Web
Kendo UI Web 和 Kendo UI Core 之间有什么区别 https://www.nuget.org/packages/KendoUIWeb http://www.nuget.org/
kendo-ui - Kendo UI MVVM 与 Kendo UI 拖放
我正在尝试将 Kendo UI MVVM 框架与 Kendo UI 拖放机制结合使用；但是我很难找到如何从 draggable 对象中删除数据。我的代码是这样的…… var viewModel =
angularjs - Angular UI - UI-Router - 在子 ui-view 上传递数据和调用函数
使用 Angular JS - UI 路由器，我需要从我的父 View project.details 到我的 subview project.details.tasks 进行通信。我的 subvie
kendo-ui - Kendo UI Flatcolorpicker 在 Kendo UI 窗口中无法正确呈现
KendoUI 版本 2013.3.1119使用 Kendo MVVM 我有一个我构建的颜色选择器，它使用平面颜色选择器和使用调色板的颜色选择器。它们都可以正常运行，但平面颜色选择器的布局已关闭， s
c# - 如何从非 UI 线程获取 UI SynchronizationContext 并且没有表单或 UI 创建的任何对象
我在非 UI 线程上，我需要创建并显示一个 SaveDialog。但是当我尝试显示它时:.ShowDialog() 我得到: "An unhandled exception of type 'Syst
css - 为什么 .ui-widget 匹配 .ui-widget .ui-widget
我正在试验 jquery-ui 并查看和克隆一些示例。在一个示例(自动完成的组合框)中，我看到一个带有 ui-widget 类的 anchor (a) 元素，它与包含的 css 文件中的 .ui-wi
angular - 类型 'Observable>' 不可分配给类型 'Observable' 。类型 'UI[] | Promise' 不可分配给类型 'UI[]'
我需要返回一个 UI 列表，我用这个方法: getList(): Observable { return this.httpClient.get("/api/listui").pipe
angular-ui-bootstrap - ui-grid 在 angular-ui-tab 中消失
我有 ui-grids在 angular-ui-tabs ，它们位于 ng-if 中以避免呈现问题。如果有更多数据并且网格进入滚动模式，则单击选项卡时数据会完全消失。我相信这是一个 ui-grids-
reactjs - material-ui lab@material-ui/lab/和material-ui core中组件的区别
这似乎是一个通用的问题，与其他几个 React 开源框架相比，我真的很喜欢 Material ui 的可扩展性。问题 “@material-ui/core”和“@material-ui/lab”中的
javascript - Angular UI Router - 根据另一个 ui-view 更改子菜单 ui-view
我有一个根页面(index.html)，带有侧边栏(“菜单”)和主要内容 div(“主”)，因此有两个 ui-view div - 一个称为“菜单”，一个称为“主”。当主要内容区域有网站列表 (/s
jquery-ui - 如何在 Angular 中从一种 ui-sortable 迁移到另一种 ui-sortable？
有人在http://jsfiddle.net/hKYWr/上整理了一个很好的 fiddle 。关于使用 angular-ui 和 jqueryui sortable 来获得良好的可排序效果。如何在两

首页

博学

6Ren·AI

商城

python - 在 BeautifulSoup 中处理无限滚动 UI