python - 需要接受隐私政策才能访问页面-6ren

python - 需要接受隐私政策才能访问页面

转载作者：太空宇宙更新时间：2023-11-04 04:23:41

25

4

我正在尝试从 AllRecipes.co.uk 抓取信息，但是当代码运行时，我没有被定向到预期的页面，而是被定向到一个要求我事先接受隐私政策的封面。这意味着我无法从我想要的页面上抓取，因为我访问的任何页面都带有此接受隐私政策封面

网站是 AllRecipes.co.uk

import requests
from bs4 import BeautifulSoup
import time
from selenium import webdriver
import numpy as np
import os


userAgent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
headers = {
        'user-agent': userAgent
    }

dishType = "main-recipes"
url = 'http://allrecipes.co.uk/recipes/' + dishType + '.aspx?page='
#endPage = 1259
endPage = 3
for i in range(2, endPage):
    delays = [5, 7, 9, 11, 13, 15]
    delay = np.random.choice(delays)
    time.sleep(delay)
    print("Getting request " + str(i))
    r = requests.get(url + str(i))
    soup = BeautifulSoup(r.content, "html.parser")
    print(soup)
    #names = soup.findAll('div', attrs = {'class' : "col-sm-7"})
    #for name in names:
    #    print(name)

最佳答案

您只需要设置 euConsentId cookie:

In [1]: import requests

In [2]: from bs4 import BeautifulSoup

In [3]: url = "http://allrecipes.co.uk/recipes/main-recipes.aspx?page=2"

In [4]: BeautifulSoup(requests.get(url).content, "html.parser").title.get_text()
Out[4]: 'About your privacy on this site'

In [5]: import uuid

In [6]: BeautifulSoup(requests.get(url, cookies={'euConsentId': str(uuid.uuid4())}).content, "html.parser").title.get_text()
Out[6]: 'Main course recipes - All recipes UK '

为了在您的代码中进行调整，我将实例化一个 "session"并在那里设置 cookie:

import uuid4

consent_id = str(uuid.uuid4())
with requests.Session() as session:
    session.cookies = {'euConsentId': consent_id}

    response = session.get(...)

关于python - 需要接受隐私政策才能访问页面，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53935093/

25

4

0

文章推荐： python - 在 python 3.6 中提取 xlsx 工作簿文件元数据/属性

文章推荐： javascript - 交换后 radio 相互重叠

文章推荐： python - PyInstaller ErroNo2 "No such file or directory: ' akespec'"

文章推荐： css - 为什么 css 旋转会弄乱 child 的倾斜

Javascript方式设计继承+隐私
我读了 Douglas Crockford 所著的《JavaScript:The Good Parts》一书以及许多其他资源，但我对在 Javascript 中实现继承和隐私有(private)点困惑
ada - 打破测试功能的 Ada 隐私
假设我有两个包: with Ada.Streams; use Ada.Streams; package P is type SEA is new Stream_Element_Array (1.
ios - 如何使用YouTube中未列出的“隐私”设置上传视频
我正在使用此代码在youtube上上传视频。 - (void)sendVideoFileMetadata:(NSDictionary *)videoMetadata
ios - 我的应用程序未显示在定位服务下(设置->隐私)
我开发了基于位置的应用程序，它能够获取用户的位置，但其中有一些奇怪的事情。在设置->隐私->位置服务下，它没有显示我的应用程序。对于它所展示的其他设备，只有 iPhone 6 Plus 才会出现这种情
IPA 中文件的 iOS 隐私
我已经在我的 iOS 项目中添加了一个 sqlite 数据库，我希望它是私有(private)的，我不希望任何用户看到里面的内容。但是一旦创建了 .ipa 文件，如果我将其扩展名更改为 .zip 并查
php - 在外部网站上使用 Facebook 隐私
我不确定这个标题是否合适。让我描述一下我的想法。我不熟悉 facebook API。你看，我在网站上有这个页面。我希望这个页面只对我在 Facebook 上的 friend 可见。有什么办法可以
cordova - 如何在iOS phonegap应用程序中链接到设置->隐私->定位服务
我正在使用 phonegap 制作应用程序，当用户不允许某个权限(例如 GPS)时，应用程序下次使用该功能时不会再次询问，我认为我能做的最好只是显示这样的消息: 请转至 iOS 设置 > 隐私 > 定
iphone - 如何使用CFUUID，CFUUID是否可以追溯到唯一的个体。安全/隐私
我是 iPhone 开发人员和 CFUUID 概念的新手，所以我想在开始实现它之前我应该问一下。所以 CFUUID 返回的字符串是否真的是唯一的，或者是否可以追溯到唯一的个体。意思是，我生成一个
google-analytics - 隐私、保护、默默无闻
我正在做一个项目，客户提出了一些有趣的要求。想知道是否有人有任何建议或想权衡。我正在为我的客户创建一个 Web 应用程序，以便在公司内部分发给少数人。他们需要能够从世界任何地方访问 Web 应用程序
r - Plotly with R ggplot 隐私
我正在使用 ggplot 和 plotly 绘制图表。如何在 plotly 上将 plotly 设为私有(private)而不是公开？我的代码如下所示: a <- ggplot(data, aes(v
go - HTTPS连接在浏览器中显示“隐私”错误。 -球童服务器
修改我的Caddyfile在此平台上尝试推荐后...我仍然无法获得我浏览器中的HTTPS连接。Chrome一直在说 “Your connection is not private Attackers
ios - 我如何提示用户打开位置服务，即转到设置→隐私→位置服务
下面的代码不能再工作了，我们能做什么 [[UIApplication sharedApplication] openURL:[NSURL URLWithString: @"prefs:root=LOC
core-location - 隐私 - 位置默认精度降低 (NSLocationDefaultAccuracyReduced) 不尊重
在应用程序 Info.plist 文件中设置 Privacy - Location Default Accuracy Reduced 然后调用 locationManager.requestWhenI
macos - osx-以编程方式打开“隐私”>“辅助功能”窗口
我正在开发需要从“系统偏好设置”>“安全和隐私”>“隐私”>“辅助功能”启用的应用程序。现在，我正在使用以下代码打开下面屏幕截图中显示的窗口: -(IBAction)enableAccessibil
python - 尊重 argparse 隐私，并且。可用性
总的来说，我非常努力尊重模块的隐私(如果变量以下划线为前缀，我不会使用它)。然而，我有一个极端的情况，它看起来相当“安全”。这是演示 ( my previous question ) parser=
android - 即使有公共(public)隐私，Facebook 帖子也不可见
我正在使用适用于 Android 的 Facebook SDK 3 在我的墙上分享状态。我授权我的所有 friend 都可以看到该发布，该帖子发布得很好，但即使有隐私，也没有人能看到它:公共(publ
iOS 应用程序在后台崩溃，因为设置->隐私->联系人我的应用程序开/关
在我的应用程序中，我直接获取联系信息购买这样做... ABAddressBookRef m_addressbook = ABAddressBookCreate(); CFArrayRef allPeo
javascript - 隐私 - 跟踪 Chrome 扩展程序的传出 AJAX 查询
是否有任何可能的方法来跟踪 Chrome 扩展程序从网站发出的网络通信？假设 Chrome“内容脚本”扩展程序将 AJAX 查询发送到指定 IP 上的服务器以创建自定义分析。当用户浏览各种网站时，此
javascript - 隐私 : Underscored prototype properties or encapsulated variables?
有件事一直困扰着我，就像人们意识到了我没有意识到的事情一样。我正在看一个 FOSS 示例(下面进行了简化)...每当我有一个 JavaScript 类时，我更喜欢 Crockford 的变量隐藏方法:
ios - 如何以编程方式在 iOS 11+ 中打开设置 > 隐私 > 定位服务？
如果 locationServicesEnabled 返回 false，我会提示用户启用他们的定位服务。以下 URL 适用于 10.0+，将用户重定向到“设置”应用并直接转到“定位服务”屏幕: URL

首页

博学

6Ren·AI

商城

python - 需要接受隐私政策才能访问页面