javascript - Puppeteer Bright Data 代理返回 ERR_NO_SUPPORTED

javascript - Puppeteer Bright Data 代理返回 ERR_NO_SUPPORTED_PROXY 或 CERT 错误

转载作者：行者123 更新时间：2023-12-05 00:26:56

28

4

所以我继续使用 Bright Data，注册了一个帐户，并获得了我的 Search Engine Crawler 代理。下面是我的抓取功能:

async function scrape() {
  try {
    const preparePageForTests = async (page) => {

          const userAgent = 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36';//'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36';

          await page.setUserAgent(userAgent);

          await page.evaluateOnNewDocument(() => {
            Object.defineProperty(navigator, 'webdriver', {
              get: () => false,
            });
          });

          // Pass the Chrome Test.
          await page.evaluateOnNewDocument(() => {
            // We can mock this in as much depth as we need for the test.
            window.navigator.chrome = {
              app: {
                isInstalled: false,
              },
              webstore: {
                onInstallStageChanged: {},
                onDownloadProgress: {},
              },
              runtime: {
                PlatformOs: {
                  MAC: 'mac',
                  WIN: 'win',
                  ANDROID: 'android',
                  CROS: 'cros',
                  LINUX: 'linux',
                  OPENBSD: 'openbsd',
                },
                PlatformArch: {
                  ARM: 'arm',
                  X86_32: 'x86-32',
                  X86_64: 'x86-64',
                },
                PlatformNaclArch: {
                  ARM: 'arm',
                  X86_32: 'x86-32',
                  X86_64: 'x86-64',
                },
                RequestUpdateCheckStatus: {
                  THROTTLED: 'throttled',
                  NO_UPDATE: 'no_update',
                  UPDATE_AVAILABLE: 'update_available',
                },
                OnInstalledReason: {
                  INSTALL: 'install',
                  UPDATE: 'update',
                  CHROME_UPDATE: 'chrome_update',
                  SHARED_MODULE_UPDATE: 'shared_module_update',
                },
                OnRestartRequiredReason: {
                  APP_UPDATE: 'app_update',
                  OS_UPDATE: 'os_update',
                  PERIODIC: 'periodic',
                },
              }
            };
          });

          await page.evaluateOnNewDocument(() => {
            const originalQuery = window.navigator.permissions.query;
            return window.navigator.permissions.query = (parameters) => (
              parameters.name === 'notifications' ?
                Promise.resolve({ state: Notification.permission }) :
                originalQuery(parameters)
            );
          });

          await page.evaluateOnNewDocument(() => {
            // Overwrite the `plugins` property to use a custom getter.
            Object.defineProperty(navigator, 'plugins', {
              // This just needs to have `length > 0` for the current test,
              // but we could mock the plugins too if necessary.
              get: () => [1, 2, 3, 4, 5],
            });
          });

          await page.evaluateOnNewDocument(() => {
            // Overwrite the `plugins` property to use a custom getter.
            Object.defineProperty(navigator, 'languages', {
              get: () => ['en-US', 'en'],
            });
          });
        }

        //the below is the Search Engine Crawler proxy used from the luminati/bright data sign up. This returns ERR_CERT_INVALID or ERR_CERT_AUTHORITY_INVALID
        const oldProxyUrl = 'http://lum-customer-customerID-zone-zone1:customerPassword@zproxy.lum-superproxy.io:22225'
        const newProxyUrl = await proxyChain.anonymizeProxy(oldProxyUrl); //if this line is commented out, I get the ERR_NO_SUPPORTED_PROXY

        const browser = await puppeteerExtra.launch({ 
          headless: true, 
          args: [                
            '--no-sandbox', 
            '--disable-setuid-sandbox', 
            `--proxy-server=${newProxyUrl}`
            //If I add 'ignoreHTTPSErrors: true' here then I can bypass the CERT errors but then it seems like I can't navigate the browser anymore to a different page.                     
          ]
        });

        const page = await browser.newPage();

        await preparePageForTests(page);

        await page.setViewport({ width: 1440, height: 1080 });

        await page.goto('https://www.google.com/search?q=concerts+near+new+york');   
        
        await page.screenshot({ path: `screenshot.jpeg` });

  } catch(err) {
    console.log(err)
  }
}

不知道如何解决这个问题。我相信这里的错误是用 ignoreHttpsErrors 绕过 CERT 错误。当我根本不使用代理时，我的分析功能(基本上包含下面看到的第一个 'ul' 列表)工作正常，但如果我使用代理，它出于某种原因给我第二页上的数据.
任何帮助将非常感激!
'ul' 的格式很好，数据很容易获得:
/image/RwiHM.jpg
只有几个“ul”元素是可见的，然后我得到了一堆我不想退回的东西。我试着做一个

page.$eval(".BXE0fe", element => element.click())

但由于某种原因，这并没有重定向页面:
/image/3DTay.png

最佳答案

除了 Yevgeniy 提出的针对 Google 的观点(他是对的，顺便说一句，对于 Google，您需要使用他们的 SERP 产品)，如果您通过 HTTPS 请求，您需要安装他们的 CA 证书并通过代理管理器发送请求，而不是通过直接使用 Superproxy，因为 this，这对于 headless Chromium 甚至都不重要.

关于javascript - Puppeteer Bright Data 代理返回 ERR_NO_SUPPORTED_PROXY 或 CERT 错误，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67913132/

28

4

0

文章推荐： javascript - block vendor 文件在生产中太大

文章推荐： javascript - Svelte:未捕获的 ReferenceError:未定义导出

puppet - puppet 继承VS puppet 组成
我最近刚跨过木偶继承。围绕它的几个问题：使用p继承是一种好习惯吗？一些经验丰富的木偶同事告诉我，木偶的继承不是很好，我不太相信。来自OO世界，我真的很想了解木偶继承的原理，以及覆盖的原理。最佳答
puppet - 如何从一个 puppet 代理中使用多个不同的 puppet 师？
需要一个 puppet 特工联系一些不同 puppet 师。原因:不同的组创建了不同且独立的 list 集。可能的组及其任务应用程序供应商:应用程序的配置安全性:强化运营:路由表、监控工具
puppet - puppet 中的子模块？
您可以在 puppet 中制作子模块吗，例如... puppet_root - modules - module_1 - submodule - manifes
puppet - Puppet 中的类排序
在执行类 mypackage 中的代码之前，我需要执行类 mysql,tomcat。在我的 site.pp 我有 node 'node1' { include mysql,mypackage,tomc
puppeteer - puppeteer 无法捕捉失败的请求和错误
我试图从失败的请求和js错误中收集数据。我正在使用以下网站:https://nitzani1.wixsite.com/marketing-automation/3rd-page 该网站有一个对htt
puppet - puppet 家族核心事实是如何确定的？
我在 Suse 11 Linux 机器上使用 puppet 2.7.19 和 facter 1.6.0。 $::osfamily因子变量未设置，尽管它确实有 $::operatingsystem事实集
puppet - puppet 组件如何相互配合？
我正在使用 Puppet 开源版本。我发现 Puppet 3.7.5 中有几个组件: puppet 大师 puppet 代理 MCollective 希拉 puppet 数据库但我不知道他们是如何
puppet - 我可以通过 puppet manifest 安装 puppet 模块吗？
主要目标是自动添加所有 puppet 模块，以便可以使用一个命令启动所有 dev-env 和 prod-env。如何通过 puppet manifest 安装 puppet 模块？最佳答案我们一直
puppet - Puppet 中的执行顺序
我的 Puppet list 中有一系列 exec: 第一个下载带有二进制文件的 ZIP 文件(除非已经安装了二进制文件)并将其保存到 /tmp。第二个将其解压缩。当我第一次应用 list 时，它
puppet - Windows Puppet 代理无法连接到 AWSOpsWorks Puppet Enterprise 主服务器
我使用 aws opsworks 创建了 puppet master。我可以将 ami linux 节点自动添加到 puppet master。当我尝试通过此链接 https://puppet.co
puppet - 如何使用 puppet module install 从本地 repo 安装 puppet 文件
关于 this 的另一个问题问题。有没有办法puppet module install从我已经下载到磁盘的本地存储库安装的工具？最佳答案您可以使用Puppet Library托管您自己的私有(p
linux - 无法使用 Puppet Enterprise 从 Puppet 运行命令来更新 Puppet Agent 的服务器
我可以通过 Puppet Enterprise Master 到 Agent 运行几乎所有其他命令，但更新命令不会运行。据我所知，PE确实以root身份运行。有人可以建议如何让这个命令在 Linux
puppeteer - 如何在 puppeteer 中设置标题只是主页请求而不是所有请求
我只想在 puppeteer 中刚刚打开的页面中应用标题，而不是在所有内部页面标题中应用标题 page.setExtraHTTPHeaders({ 'X-Just-Must-Be-Req
puppet - 在 Puppet 中声明数组元素之间的依赖关系
有没有什么方法可以用 Puppet 的语言声明数组中的包应该按照它们在数组中给出的顺序安装？我想自动安装 CUDA，这需要 nvidia-driver-latest-dkms、cuda 和 cuda
puppet - 通知如何遍历 Puppet 资源链？
鉴于这个简化的 Puppet 示例，很明显，由于 ~> 链接运算符，对 my_file 的任何更改都会触发 my_service 刷新: package { 'my_package': } -> fi
puppeteer - 如何使用 puppeteer 选择单选按钮
我是第一次使用 puppeteer，而不是工程师/程序员! 我已经能够生成我尝试使用 puppeteer 的大部分表单，但是我被单选按钮卡住了。网络表单中的开发人员工具显示该字段的以下内容: 使用:
puppet - 用于查看 Puppet 代理所做的最后更改的日志文件
如果您为代理在后台运行时执行 puppet agent -t，我们可以在其中看到更改的日志文件在哪里，而不是在 puppet 仪表板上。我查看了 puppet.conf 并在主要部分看到了 logd
puppet - 在 puppet 类之间传递变量
我正在尝试使用 exec 资源类型来执行批处理文件。但我想将变量 $dsn_64bit 的值从 init.pp 传递到 install.pp。请让我知道如何实现: 这是我的 init.pp class
puppet - 使用 Puppet 将用户添加到多个组
我正在尝试使用 list 将用户分配到多个组，但遇到了障碍。尝试 1: class usergroup { group { "user_one": ensure => present
puppet - 我应该和 puppet 一起走多远？
我想先说我是 puppet 的新手。我一直在通过 vagrant 使用它并且我开始对写作表现感到自在，但我可能缺乏可以回答我的问题的经验或直觉。我试图掌握 puppet 的范围以及画线的位置。我对这

首页

博学

6Ren·AI

商城

javascript - Puppeteer Bright Data 代理返回 ERR_NO_SUPPORTED_PROXY 或 CERT 错误