python - HTTP 错误 999 : Request denied-6ren

python - HTTP 错误 999 : Request denied

转载作者：太空狗更新时间：2023-10-30 02:29:53

26

4

我正在尝试使用 BeautifulSoup 从 LinkedIn 抓取一些网页，但我不断收到错误“HTTP 错误 999:请求被拒绝”。有没有办法避免这个错误。如果您查看我的代码，我已经尝试过 Mechanize 和 URLLIB2，但两者都给我同样的错误。

from __future__ import unicode_literals
from bs4 import BeautifulSoup
import urllib2
import csv
import os
import re
import requests
import pandas as pd
import urlparse
import urllib
import urllib2
from BeautifulSoup import BeautifulSoup
from BeautifulSoup import BeautifulStoneSoup
import urllib
import urlparse
import pdb
import codecs
from BeautifulSoup import UnicodeDammit
import codecs
import webbrowser
from urlgrabber import urlopen
from urlgrabber.grabber import URLGrabber
import mechanize

fout5 = codecs.open('data.csv','r', encoding='utf-8', errors='replace')

for y in range(2,10,1):


    url = "https://www.linkedin.com/job/analytics-%2b-data-jobs-united-kingdom/?sort=relevance&page_num=1"

    params = {'page_num':y}

    url_parts = list(urlparse.urlparse(url))
    query = dict(urlparse.parse_qsl(url_parts[4]))
    query.update(params)

    url_parts[4] = urllib.urlencode(query)
    y = urlparse.urlunparse(url_parts)
    #print y



    #url = urllib2.urlopen(y)
    #f = urllib2.urlopen(y)

    op = mechanize.Browser() # use mecahnize's browser
    op.set_handle_robots(False) #tell the webpage you're not a robot
    j = op.open(y)
    #print op.title()


    #g = URLGrabber()
    #data = g.urlread(y)
    #data = fo.read()
    #print data

    #html = response.read()
    soup1 = BeautifulSoup(y)
    print soup1

最佳答案

您应该使用 LinkedIn REST API ，直接或使用 python-linkedin .它允许直接访问数据，而不是试图抓取大量使用 JavaScript 的网站。

关于python - HTTP 错误 999 : Request denied，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30288642/

26

4

0

文章推荐：来自两个不重叠范围的 Python 随机唯一值

文章推荐： python - sqlite3 "OperationalError: near "(": syntax error" python

文章推荐： python - 从外部网络访问 SimpleHTTPServer

文章推荐： python - 将 einsum 计算转换为要在 Theano 中使用的点积

docker 推 "denied: requested access to the resource is denied"
我在 Ubuntu Linux Server 20.04这是我第一次向 Docker 推送东西，所以我只是在本地创建了一个虚拟容器并且它工作了。按照一些在线教程，hello-world示例也可以正常工
docker 推送错误 "denied: requested access to the resource is denied"
尝试将图像推送到 Docker Hub 上的公共(public)存储库时会发生此错误。我尝试过的其他注册表没有问题。我查看了很多网站、博客，包括 StackOverflow，但仍然没有明确的答案。
apache - (13)Permission denied : access to/wsgi denied, mod_wsgi, CentOs
我有个问题。我有操作系统 CentOS 5.8 。我在 httpd.conf 文件中写了这个配置: Listen 85 并在文件末尾: ServerName localhost ServerAdmi
linux - 当/dev/null 也给出 "permission denied"时消除 'permission denied'
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 关闭 9 年前。 Improve
python 服务器配置。 IOError : [Errno 13] Permission denied(Permission denied to . ..日志文件)
请帮我配置 python 服务器。当我使用 python 命令在 cmd 中执行 .pyw 文件时出现错误我收到错误: IOError: [Errno 13] Permission denied(Pe
linux - (13)Permission denied : access to/cgi-bin/test. cgi denied
我是第一次尝试 CGI 脚本，但没有成功。我已经阅读了很多教程并关注了不同论坛中的主题，但我无法使其正常工作。我在 Fedora 10 机器上使用 appache 网络服务器。我总是有问题 [Wed
python - 1045、 "Access denied"使用两个 python 文件，一个有效，另一个 "Access denied"？
在两个文件中使用相同的 mdb.connect 行。使用 debian 7，我的问题现在是向您提供更多详细信息，因为我在问题中使用了很多代码，但我没有什么可告诉的。文件 1 工作正常。 #!/usr/
google-sheets - BigQuery 错误 : Access Denied: BigQuery BigQuery: Permission denied while getting Drive credentials
我正在尝试将数据洞察报告连接到表格和 BigQuery 中的 View 。在 BigQuery 中，表从位于我的云端硬盘中的 GoogleSheet 接收数据， View 正在查询同一个表，但添加了一
docker - 创建 list 时如何修复来自 Docker Hub 的 "denied: requested access to the resource is denied"错误
我正在尝试为我的 docker hub 存储库创建一个 list ，以便我拥有一个多平台镜像。我的程序如下: 我首先创建一个空的存储库并向其中推送两个图像，一个用于 amd64，另一个用于 arm6
php - FUELCMS(codeigniter)htaccess : order takes one argument, 'allow,deny'， 'deny,allow'，错误
我正在尝试在我的 arch linux lamp 服务器中使用 fuecms。但是我不能让 htaccess 工作。我的主文件夹是 ytsejam/fuel_cms/.. 这是我的 .htaccess
docker - 错误无法将图像 'library/web:latest' 推送到注册表 'docker.io'。错误 : denied: requested access to the resource is denied - Kompose up
我有一个简单的docker-compose.yml文件以这种方式定义: version: '3' services: db: image: postgres:10.5-alpine
docker - Alpine Docker 错误 : Unable to lock database: Permission denied ERROR: Failed to open apk database: Permission denied
所以我使用了 testcafe 的默认 docker，它在 docker hub 上是 testcafe/testcafe，我必须运行一些 testcafe 脚本。但是，我需要将错误触发的屏幕截图上
rest - channel :mychannel received discovery error:access denied Failed to evaluate transaction: Error: DiscoveryService: mychannel error: access denied
我在 ubuntu 上使用 Hyperledger Fabric 2.2。我正在尝试借助 article 使用 express.js 创建 REST API . 我的结构网络和 apiserver.j
macos - Logstash 6.7.0 在 macOS Mojave (10.14.4) 上无法启动，并出现错误 “Error: Permission denied - Permission denied”
最近将 macOS Mojave (10.14.4) 上的 Logstash(通过 Homebrew 安装)升级到版本 6.7.0，但事情没有按预期运行。当我尝试通过命令行手动运行它(出于本地开发目的
macos - Logstash 6.7.0 在 macOS Mojave (10.14.4) 上无法启动，并出现错误 “Error: Permission denied - Permission denied”
最近将 macOS Mojave (10.14.4) 上的 Logstash(通过 Homebrew 安装)升级到版本 6.7.0，但事情没有按预期运行。当我尝试通过命令行手动运行它(出于本地开发目的
关于标签 "access-denied-page"cvc-complex-type.3.2.2 : Attribute 'access-denied-page' is not allowed to appear 的 spring 安全警告
我的想法是 eclipse-luna 。系统是windows 7旗舰版。我使用 spring security 将 *.jar 复制到我的项目并“添加到构建路径”。请查看有关警告的图片
permission-denied - 如何更改vmware共享文件夹的权限
我在 vmware 播放器上使用 ubuntu 16.04。共享文件夹已启用并且在/mnt/fghs 上可见。但是，所有者(root)不能被 chown 改变。如何改变它？请给我建议。另外，有人说修
sql - 为什么在数据控制语言中使用 "Deny"？
我刚开始学习 SQL 的基础知识，当我在搜索数据操作语言、数据控制语言、数据定义语言时，有些东西没有意义。据我了解，Data Control Language 有 3 个关键词:Grant、Deny
.htaccess - "deny from all"带有自定义消息？
我要迁移到新服务器，并希望在过渡期间将我的所有站点都脱机。我知道我可以将它放在我的根 .htaccess 文件中以阻止人们访问该站点: order deny,allow deny from all 但
尝试在新创建的目录中创建文件时转到 "permission denied"？
我正在尝试使用 os.Mkdir() 创建一个目录，然后在其中创建文件，类似于这个脚本: package main import ( "log" "os" "path" ) f

首页

博学

6Ren·AI

商城

python - HTTP 错误 999 : Request denied