php - 如何在Python中解码使用gzip压缩的源代码-6ren

php - 如何在Python中解码使用gzip压缩的源代码

转载作者：太空宇宙更新时间：2023-11-03 16:57:28

25

4

我正在尝试使用代理获取 php 网页的源代码，但它显示不可打印的字符。我得到的输出如下:

 "Date: Tue, 09 Feb 2016 10:29:14 GMTServer: Apache/2.4.9 (Unix) OpenSSL/1.0.1g PHP/5.5.11 mod_perl/2.0.8-dev Perl/v5.16.3X-Powered-By: PHP/5.5.11Set-Cookie: PHPSESSID=jmqasueos33vqoe6dbm3iscvg0; path=/Expires: Thu, 19 Nov 1981 08:52:00 GMTCache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0Pragma: no-cacheContent-Encoding: gzipVary: Accept-EncodingContent-Length: 577Keep-Alive: timeout=5, max=99Connection: Keep-AliveContent-Type: text/html�TMo�@�G����7�)P�H�H�DS��=U�=�U�]˻��_�Ycl�T�*�>��eg��                                                          ����Z�                                                                �V�N�f�:6�ԫ�IkZ77�A��nG�W��ɗ���RGY��Oc`-ο�ƜO��~?�V��$�                            �l4�+���n�].W��TǇSx�/|�n��#���>��r����;�l����H��4��f�\  �SY�y��7��"

如何使用 python 解码此代码，我尝试使用

decd=zlib.decompress(data, 16+zlib.MAX_WBITS)

但没有给出解码数据

我正在使用的代理对于其他一些网络应用程序来说工作得很好。它显示某些 Web 应用程序的不可打印字符，如何解码？

由于我使用代理，我不想使用 get() 和 urlopen() 或来自 python 程序的任何其他请求。

最佳答案

一种明显的方法是从响应中提取压缩数据并使用GzipFile().read()对其进行解压缩。这种分割响应的方法可能容易失败，但情况如下:

from gzip import GzipFile
from StringIO import StringIO

http = 'HTTP/1.1 200 OK\r\nServer: nginx\r\nDate: Tue, 09 Feb 2016 12:02:25 GMT\r\nContent-Type: application/json\r\nContent-Length: 115\r\nConnection: close\r\nContent-Encoding: gzip\r\nAccess-Control-Allow-Origin: *\r\nAccess-Control-Allow-Credentials: true\r\n\r\n\x1f\x8b\x08\x00\xa0\xda\xb9V\x02\xff\xab\xe6RPPJ\xaf\xca,(HMQ\xb2R()*M\xd5Q\x00\x89e\xa4&\xa6\xa4\x16\x15\x03\xc5\xaa\x81\\\xa0\x80G~q\t\x90\xa7\x94QRR\x90\x94\x99\xa7\x97_\x94\xae\x04\x94\xa9\x85(\xcfM-\xc9\xc8\x07\x99\xa0\xe4\xee\x1a\xa2\x04\x11\xcb/\xcaL\xcf\xcc\x03\x89\x19Z\x1a\xe9\x19\x9aY\xe8\x19\xea\x19*q\xd5r\x01\x00\r(\xafRu\x00\x00\x00'

body = http.split('\r\n\r\n', 1)[1]
print GzipFile(fileobj=StringIO(body)).read()

输出

{  "gzipped": true,   "headers": {    "Host": "httpbin.org"  },   "method": "GET",   "origin": "192.168.1.1"}

If you feel compelled to parse the full HTTP response message, then, as inspired by this answer, here is a rather roundabout way to do it which involves constructing a httplib.HTTPResponse directly from the raw HTTP response, using that to create a urllib3.response.HTTPResponse, and then accessing the decompressed data:

import httplib
from cStringIO import StringIO
from urllib3.response import HTTPResponse

http = 'HTTP/1.1 200 OK\r\nServer: nginx\r\nDate: Tue, 09 Feb 2016 12:02:25 GMT\r\nContent-Type: application/json\r\nContent-Length: 115\r\nConnection: close\r\nContent-Encoding: gzip\r\nAccess-Control-Allow-Origin: *\r\nAccess-Control-Allow-Credentials: true\r\n\r\n\x1f\x8b\x08\x00\xa0\xda\xb9V\x02\xff\xab\xe6RPPJ\xaf\xca,(HMQ\xb2R()*M\xd5Q\x00\x89e\xa4&\xa6\xa4\x16\x15\x03\xc5\xaa\x81\\\xa0\x80G~q\t\x90\xa7\x94QRR\x90\x94\x99\xa7\x97_\x94\xae\x04\x94\xa9\x85(\xcfM-\xc9\xc8\x07\x99\xa0\xe4\xee\x1a\xa2\x04\x11\xcb/\xcaL\xcf\xcc\x03\x89\x19Z\x1a\xe9\x19\x9aY\xe8\x19\xea\x19*q\xd5r\x01\x00\r(\xafRu\x00\x00\x00'

class DummySocket(object):
    def __init__(self, data):
        self._data = StringIO(data)
    def makefile(self, *args, **kwargs):
        return self._data

response = httplib.HTTPResponse(DummySocket(http))
response.begin()
response = HTTPResponse.from_httplib(response)
print(response.data)

输出

{  "gzipped": true,   "headers": {    "Host": "httpbin.org"  },   "method": "GET",   "origin": "192.168.1.1"}

关于php - 如何在Python中解码使用gzip压缩的源代码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35290083/

25

4

0

文章推荐： phpunit 不工作

文章推荐： ruby - ruby 正则表达式中的引号被误解为字符串的开头

文章推荐： mod-rewrite - mod_rewrite 缩短 url 文件路径

文章推荐： c# - Winforms 文本框每页行数

在浏览器中显示的Java字符串(源代码)
我正在编写一个 Java 应用程序，该应用程序检查网页的源代码，并在满足源代码中的条件时在我的默认浏览器中向我显示该网页。我通过以下方式获取源代码: String source = getUrlSou
安卓蓝牙-源代码
数周以来，我一直在为 Android 上的蓝牙项目而苦苦挣扎。有谁知道我可以去哪里查看 Google 用于使其蓝牙配对和连接逻辑正常工作的实际代码？我浏览了所有的文档、BluetoothChat 应
Hadoop 源代码
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 4 年前。
特定设备的 Android 源代码
Android 源代码有多个目录，其中包含针对不同设备的代码。此外，在特定目录中，存在显示不同分支和标签的路径。举个例子，在“android/platform/external/iptables”目录
.net - SQLMembershipProvider - 源代码
在哪里可以找到 SQLMembershipProvider (.NET2.0) 的源代码？是可用的么？最佳答案源代码已经发布。 See ScottGu's blog for further de
下载特定的 Android 源代码
我只想知道如何下载特定版本的 Android 源代码。我已经尝试过以下命令 repo init -u https://android.googlesource.com/platform/manifes
frameworks - OpenCL 源代码？
我想看看OpenCL框架是如何实现的。我发现的只是已经编译好的可供下载的库。当然，OpenCL 可以有许多不同的实现，但我想看看其中的一个来了解它是如何完成的。为了确保我自己清楚，OpenCL 框
像专业书籍中一样列出 LaTeX 源代码
latex 源代码列表应该是什么样子才能产生像已知书籍中那样的输出，例如 Spring 框架的输出？我尝试过使用 latex 列表包，但无法生成看起来像下面一样好的东西。因此，我主要对生成类似以下示例
内置函数的 PHP 源代码
PHP 是用 C 语言编写的吗？我在哪里可以在线找到 PHP 源代码而无需下载全部内容？最佳答案 PHP 函数是用 C 编写的 - 您可以在 lxr.php.net 找到可浏览的源代码. 例如:ht
elasticsearch - script_score查询不支持[源代码]
我正在使用Elasticsearch OSS的官方Docker镜像(docker.elastic.co/elasticsearch/elasticsearch-oss:6.2.4)，似乎完全无法使用s
c++ - 在Cython中编译C和C++源代码
我试图在Cython中同时编译C和C++源代码。这是我当前的设置: -setup.py from distutils.core import setup from Cython.Build impor
java - 如何在java中使用selenium获取页面的常规(!)源代码？
好吧，事情是这样的:你们所有人可能都在想同样的事情:您可以使用 driver.getPageSource(); 这部分是正确的。唯一的问题是源代码以一种相当奇怪的方式编译，所有代码都在其中 \&quo
java - TwoLineListItem 源代码
由于 TwoLineListItem 自 API 17 起已被弃用，因此我已采取措施将其替换为自定义 XML 和 ViewHolder。但是，我真的希望我的应用程序看起来与使用 TwoLineList
java - getInputStream() 源代码
要从 HttpURLConnection 获取 InputStream，我们的代码如下 urlConnection.getInputStream(); 如果InputStream是一个Abstract
c++ - 如何编译没有项目文件的C++源代码？
我刚刚开始学习更多关于 C/C++ 的知识，我正在使用 Visual Studio 2013 来管理代码。我正在使用 Tobii EyeX 眼睛注视系统的项目要求我能够稍微调整此代码，但是我不明白如
ios - UIWebView 源代码
我在按钮上有一个IBAction，其中包含以下代码，我尝试使用它来检索 UIWebView 的源代码: - (IBAction)loadInAWebView:(id)sender { [self
调色板生成器的 javascript 源代码
我正在 asp.net 中创建一个网站，我只是想知道有什么方法可以使用 JavaScript 从图像生成调色板吗？类似于 1) http://www.cssdrive.com/imagepalette
c++ - WinKill() 源代码
有人可以分享 WinKill() from AutoIt 的源代码吗？？我想知道它如何处理消息(是/否/取消)以确保它得到正确处理。我想用它来清理桌面上的意外弹出窗口。最佳答案正如我们在下面的
适用于所有平台的 Opencv 源代码
我的问题与 Opencv 的源代码有关。在我看来不同的平台the Opencv website提供不同的代码结构。我只是想知道是否有可能为所有不同的平台提供一个源代码。使用相同的源代码，我可以针对不同
python - 如何将python源代码转换为C++源代码
这个问题在这里已经有了答案: Convert Python program to C/C++ code? [closed] (8 个答案) 关闭 3 年前。我一直在努力寻找一种方法将 .py 源文

首页

博学

6Ren·AI

商城

php - 如何在Python中解码使用gzip压缩的源代码