gpt4 book ai didi

r - R 中的 URL 问题

转载 作者:行者123 更新时间:2023-12-04 11:33:21 27 4
gpt4 key购买 nike

我对 R 相当陌生,并且在从福布斯网站提取数据时遇到了麻烦。

我目前的功能是:

网址 = http://www.forbes.com/global2000/list/#page:1_sort:0_direction:asc_search:_filter:All%20industries_filter:All%20countries_filter:All%20states

数据 = readHTMLTable(url)

但是,当我将 url 中的页面 # 从 1 更改为 2(或任何其他数字)时,提取的数据与第 1 页中的数据相同。出于某种原因,R 不会从正确的页面中提取数据。如果您手动将链接粘贴到带有特定页面 # 的浏览器中,则它可以正常工作。

有没有人知道为什么会这样?

谢谢!

最佳答案

这似乎是由 URL 片段引起的问题,井号表示。它本质上在页面上创建一个 anchor ,并引导您的浏览器跳转到该特定位置。

您可能会遇到这个问题,因为 readHTMLTable() 可能不会被创建来处理 URL 片段。看看您是否可以在 URL 中找到不需要 # 的同一个表的版本。

以下是一些有用的链接,可能会阐明您所遇到的情况:
What is it when a link has a pound "#" sign in it

https://support.microsoft.com/kb/202261/en-us

如果我遇到任何其他有用的东西,我会在后续评论中分享。

关于r - R 中的 URL 问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28464455/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com