gpt4 book ai didi

r - 使用 R 在 Firefox 中创建当前打开的 URL 的向量

转载 作者:行者123 更新时间:2023-12-03 15:54:58 25 4
gpt4 key购买 nike

我想使用 R 来提取当前在 Web 浏览器中打开的所有 URL。考虑以下示例:

  • 我打开了火狐浏览器。
  • 在firefox浏览器中,我打开了网址https://www.google.de/https://www.amazon.com/ .

  • 如何从 R 中提取这两个 URL,以获得以下输出?
    my_urls <- c("https://www.google.de/", "https://www.amazon.com/")
    my_urls
    ### [1] "https://www.google.de/" "https://www.amazon.com/"

    经过一些研究,我怀疑这可能与 RSelenium package 相关。 ,但不幸的是我无法找出合适的 R 代码。

    最佳答案

    你可以使用 RSQLite 包来做到这一点。

    获取您的 Firefox 配置文件的路径。

    转到资源管理器中的 %APPDATA%\Mozilla\Firefox\Profiles\。您将看到 Firefox 配置文件的文件夹。

    enter image description here

    打开文件夹并复制配置文件文件夹的位置

    将 db 设置为复制的位置,在末尾添加“places.sqlite”。设置好后,下次就不必更改数据库名称了。

    db<- 'C:\\Users\\{user}\\AppData\\Roaming\\Mozilla\\Firefox\\Profiles\\{profilefolder}\\places.sqlite'

    然后,继续执行以下操作:
    library(RSQLite)

    con <- dbConnect(drv=RSQLite::SQLite(), dbname=db)
    tables <- dbListTables(con)

    dt = dbGetQuery(con,'select * from moz_places' )

    urls<- dt$url[dt$visit_count>0]
    urls

    输出:
    [1] "https://duckduckgo.com/"                                        
    [1] "http://linkedin.com/"
    [2] "https://linkedin.com/"
    [3] "https://www.linkedin.com/"
    [4] "https://www.sciencedirect.com/"
    [5] "http://stackexchange.com/"
    [6] "https://stackexchange.com/"

    编辑:

    如果您想拥有当前的浏览历史记录,请使用以下命令:
    dt = dbGetQuery(con,'select * from moz_places' )

    dt$last_visit_date<- (as.Date(as.POSIXct(dt$last_visit_date/1000000,
    origin="1970-01-01")))
    urls<- dt$url[dt$visit_count>0 & dt$last_visit_date==Sys.Date()]
    urls

    关于r - 使用 R 在 Firefox 中创建当前打开的 URL 的向量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61104900/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com