python - Twisted 简单 HTTP 代理(续)-6ren

python - Twisted 简单 HTTP 代理(续)

转载作者：太空宇宙更新时间：2023-11-03 19:18:02

26

4

我在这个网站上找到了这个脚本:

from twisted.web import proxy, http
from twisted.internet import reactor
import sys

class MyProxy(proxy.Proxy):

    def dataReceived(self, data):
      print data 
      return proxy.Proxy.dataReceived(self, data)

class ProxyFactory(http.HTTPFactory):
  protocol=MyProxy

factory = ProxyFactory()
reactor.listenTCP(8080, factory)
reactor.run()

正如您所见，我重写了 dataReceived 方法来打印数据。运行时，将每个请求的 header 打印到标准输出:

GET http://careers.stackoverflow.com/ad/i/nNxudq0-kvjnJ84-n6osrC0-12-vYY HTTP/1.1
Host: careers.stackoverflow.com
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:12.0) Gecko/20100101 Firefox/12.0
Accept: image/png,image/*;q=0.8,*/*;q=0.5
Accept-Language: en-us,en;q=0.5
Accept-Encoding: gzip, deflate
Proxy-Connection: keep-alive
Referer: http://stackoverflow.com/questions/7052849/simple-http-proxy
Cookie: __utma=140029553.285085787.1331510700.1337692646.1337711538.33; __utmz=140029553.1337711538.33.19.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=(not%20provided); __qca=P0-608923218-1331510699748; usr=t=5TLQ0kWmkGJo&s=RgkodeSUGq8k; __utmc=140029553; __utmb=140029553.3.10.1337711538

是否可以以这样的方式(或任何其他实现)覆盖它，以便我可以将接收到的数据( header )作为字典访问，(例如:data['Host'] = 'xxxx' ...)
我还想获取该页面的所有网址。

最佳答案

既然您正在获取原始数据，请测试每一行是否是标题(/^[-a-zA-Z]+:/听起来是一个好的开始；还要注意表示结尾的双 crlf标题)，然后自己将其存储到字典中。

关于python - Twisted 简单 HTTP 代理(续)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10708148/

26

4

0

文章推荐： javascript - CSS :hover with JS problem

文章推荐： c# - vcalendar 的正确 mime 类型是什么

文章推荐： matlab - 用图像替换箭袋箭头

java线程挂起导致其他线程挂起(续)
当我的测试用例挂起时，我设法生成了线程转储。但是，这似乎不是死锁、竞争条件或资源争用。但是在我的加载测试工具中使用 3 个虚拟用户运行测试用例时，它肯定会挂起。任何人都可以在这里指出我正确的方向吗？干
使用perl清理电脑上重复文件实现代码(续)
复制代码代码如下: #!/usr/bin/perl use File::DirWalk; use File::Basename; use Data::Dumper; use warnings;
PHP多线程批量采集下载美女图片的实现代码(续)
个人认为影响的原因：匹配到的图片url并不是有效的url，文中只是简单的判断是否是相对路径，但是有些url是失效的解决办法：就是新增判断是否是真实有效url的图片复制代码
scala - 将无形可扩展记录传递给函数(续)
考虑到这个问题:Passing a Shapeless Extensible Record to a Function，Travis的答案表明，每个以可扩展记录为参数的函数都必须有一个隐式选择器作为参
Java 套接字延迟(续)
我通过这样的套接字发送ascii: outputStreamWriter(s + (char) 13); outputStreamWriter.flush(); 在现场，flush() 和通过网络发送
Tridion 核心服务更新错误 - 续
在我们正在进行的重构练习中，我们必须更改选定网站的页面模板。大多数页面都被本地化并通过下面的代码更新了他们的页面模板，但对于一些我们得到以下错误: “名称、文件名对于以下类型的项目必须是唯一的:其结构
c++ - 通用谓词作为参数的默认值-续
我知道已经有Default value on generic predicate as argument了。但是，也许现在c++ 11，c++ 14或c++ 17有了新的选择？我如何才能使这项工作
mysql - 根据一列的相似性检查所有其他列中的更改(续)
select sum(case when NumFirstNames <> 1 then 1 else 0 end) as DifferentFirstNames, sum(case when
Tomcat 证书问题 - 续
我已将:根证书、中间证书、服务器证书导入 Tomcat for Windows 的 Java Keystore。这些是 VeriSign(商业)证书.. 我们不能将 keyAlias 用于连接器 -
c++ - 从具有非虚拟父类的虚拟类继承的正确方法(续)
我的问题是基于这个问题:Correct way to inherit from a virtual class with non-virtual parent . 我的理解是否正确，在问题中描述的情况
c# - 并行交易软件(续)
我不确定是否需要使用像 PLINQ 这样的高级技术，因为我想重新表述我之前的问题 Paralleling trading software我认为我之前的问题太复杂而且不清楚，我希望现在我准确地提取了所
ios - 查看高度问题(续)
这是我在这里遇到的问题(仍未解决)的延续:link 但这可能有助于理解问题所在。我只创建了一个简单的测试项目('Empty Application')并添加了一个带有 XIB 文件的 View Con
Java下降矩阵代码(如电影，续)
好的，所以昨天我发布了一个关于创建一个模拟电影矩阵雨的 java jframe 的问题，我希望它就像这个 php 示例一样 http://mgccl.com/2007/03/30/simple-ver
c# - 续-车牌检测
从这个线程继续: What are good algorithms for vehicle license plate detection? 我开发了我的图像处理技术来尽可能强调车牌，总体而言我很满意
C 代码循环性能 [续]
这个问题在我这里的问题上继续(根据 Mystical 的建议): C code loop performance 继续我的问题，当我使用打包指令而不是标量指令时，使用内部函数的代码看起来非常相似: f
javascript - 我可以在对象创建时保留该对象的副本吗 - 续 :
这是 My Old Question 的延续这是我创建一个新学生对象的函数: function student(id, name, marks, mob, home){ this.id =
c - C 中的局部变量和静态变量(续)
建立在我的 last question我想弄清楚如何.local和 .comm指令准确地工作，特别是它们如何影响 C 中的链接和持续时间。所以我进行了以下实验: static int value;
delphi - Delphi 中的嵌套属性(续)
这个问题引用这个之前的one由 Christian Metzler 在 SO 上发布. 我唯一非常有限的关于注解的经验包括使用最近 Delphi 版本中引入的 CustomAttribute。我的问
java - Jetty - 检测断开连接的客户端(续)
我正在使用 Jetty 和 Continuations 来实现长轮询，但我没有找到检测客户端断开连接的方法。我知道，在第一次运行(创建 Continuation)和任何后续运行之间的时间里，由于 H
html - CSS 显示调整大小和裁剪后的图像 - 续
这是 CSS Display an Image Resized and Cropped 的延续.该用户的答案似乎没问题，但我需要一些帮助来改进该答案... 问:resize(缩放)如何在运行时与图像的

首页

博学

6Ren·AI

商城

python - Twisted 简单 HTTP 代理(续)