python - 扭曲的 Python getPage-6ren

python - 扭曲的 Python getPage

转载作者：太空狗更新时间：2023-10-30 01:47:23

25

4

我试图就此获得支持，但我完全感到困惑。

这是我的代码:


from twisted.internet import reactor
from twisted.web.client import getPage
from twisted.web.error import Error
from twisted.internet.defer import DeferredList
from sys import argv

class GrabPage:
 def __init__(self, page):
  self.page = page

 def start(self, *args):
  if args == ():
   # We apparently don't need authentication for this
   d1 = getPage(self.page)
  else:
   if len(args) == 2:
    # We have our login information
    d1 = getPage(self.page, headers={"Authorization": " ".join(args)})
   else:
    raise Exception('Missing parameters')

  d1.addCallback(self.pageCallback)
  dl = DeferredList([d1])
  d1.addErrback(self.errorHandler)
  dl.addCallback(self.listCallback)

 def errorHandler(self,result):
  # Bad thingy!
  pass

 def pageCallback(self, result):
  return result

 def listCallback(self, result):
  print result

a = GrabPage('http://www.google.com')
data = a.start() # Not the HTML

我希望在调用 start() 时获取提供给 pageCallback 的 HTML。这对我来说是一个皮塔饼。泰!为我糟糕的编码感到抱歉。

最佳答案

您缺少 Twisted 运作方式的基础知识。这一切都围绕着 reactor，您甚至从未运行过它。把 react 堆想象成这样:

_{(来源:krondo.com)}

在您启动 react 器之前，通过设置延迟，您所做的只是将它们链接起来，没有可触发的事件。

我建议你给Twisted Intro通过 Dave Peticolas一读。它速度很快，而且确实为您提供了 Twisted 文档没有提供的所有缺失信息。

无论如何，这里是尽可能最基本的getPage用法示例:

from twisted.web.client import getPage
from twisted.internet import reactor

url = 'http://aol.com'

def print_and_stop(output):
    print output
    if reactor.running:
       reactor.stop()

if __name__ == '__main__':
    print 'fetching', url
    d = getPage(url)
    d.addCallback(print_and_stop)
    reactor.run()

由于 getPage 返回一个延迟链，我将回调 print_and_stop 添加到延迟链。之后，我启动了 reactor。 react 器触发 getPage，然后触发 print_and_stop，打印来自 aol.com 的数据，然后停止 react 器。

编辑以显示 OP 代码的工作示例:

class GrabPage:
    def __init__(self, page):
        self.page = page
        ########### I added this:
        self.data = None

    def start(self, *args):
        if args == ():
            # We apparently don't need authentication for this
            d1 = getPage(self.page)
        else:
            if len(args) == 2:
                # We have our login information
                d1 = getPage(self.page, headers={"Authorization": " ".join(args)})
            else:
                raise Exception('Missing parameters')

        d1.addCallback(self.pageCallback)
        dl = DeferredList([d1])
        d1.addErrback(self.errorHandler)
        dl.addCallback(self.listCallback)

    def errorHandler(self,result):
        # Bad thingy!
        pass

    def pageCallback(self, result):
        ########### I added this, to hold the data:
        self.data = result
        return result

    def listCallback(self, result):
        print result
        # Added for effect:
        if reactor.running:
            reactor.stop()

a = GrabPage('http://google.com')
########### Just call it without assigning to data
#data = a.start() # Not the HTML
a.start()

########### I added this:
if not reactor.running:
    reactor.run()

########### Reference the data attribute from the class
data = a.data
print '------REACTOR STOPPED------'
print
########### First 100 characters of a.data:
print '------a.data[:100]------'
print data[:100]

关于python - 扭曲的 Python getPage，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2671780/

25

4

0

文章推荐： database - 在 ADO.NET 中访问数据库驱动程序的 C# 通用方法

文章推荐： sql - 如何按字母顺序对 SQL 查询进行排序但忽略前导数字？

python - 扭曲-工厂对象线程安全吗？
以下代码在2端口上监听，当有消息时修改全局dict对象。并且有一个计时器也会修改字典。 d = {} class x(Protocol): def dataReceived(self, dat
asynchronous - 扭曲/延期的工作原理
Twisted 怎么样？知道函数应该以异步方式执行吗？异步函数应该返回一个带有call-/errbacks的Deferred(immeadiately)，当收到“异步”数据时将被调用。接收到的数据作
logging - 扭曲。如何为每个请求在日志中写入唯一的前缀
我扭曲了服务器。它与插件一起运行。我想根据请求为每个条目编写唯一的前缀。这意味着当user1发出请求时，它将生成一个唯一的字符串，该字符串将以日志记录为前缀（仅用于此请求）。当user2发出请求时，
matlab - 扭曲/弯曲的点云
我正在使用校准的立体声对进行稀疏重建。这是我一步一步采取的方法: 1- 我使用 MATLAB 中的立体相机校准器应用程序校准了我的立体相机。 2-我拍摄了一对立体图像，并对每个图像进行了不失真处理。
python - 扭曲在客户端获取响应数据
我关注了这个tutorial但我不知道如何从服务器获取响应数据。 class Service(Resource): def render_POST(self, request):
javascript - 显示具有固定宽度和高度的图像而不会变形/扭曲
我的网站上有一个页面，它从数据库中获取大量图像并将它们放在一个网格中。图像的形状和大小各不相同。我想要做的是显示图像，每个图像都具有相同的宽度和高度，但不会扭曲。现在我的CSS是 .image{
Python 扭曲 - 需要遍历所有连接并找到客户端
我正在尝试创建一个简单的代金券程序。客户端连接到服务器并询问凭证上是否还有时间，如果是，服务器会响应多少时间。我控制服务器和客户端，客户端也由我编写代码。现在这就是我的服务器端，客户端是不言自明
python - 扭曲:减慢接收到的数据
假设我通过 TCP 连接快速接收数据。我必须对其进行某种处理。因为我不想阻塞 react 器线程，所以我将处理卸载到后台线程。数据到达的速度超过了我处理它的速度。如果我将数据放入队列中，队列会无限增
python - 循环http客户端python，扭曲
我有一个简单的客户端，它向服务器发送请求并接收响应: from StringIO import StringIO from twisted.internet import reactor fro
python - 扭曲、延迟的请求以及文件与错误页面
我目前正在使用 python/twisted 构建一个 http 服务器。该服务器必须在另一个 Web 服务器上获取内容，将其存储在本地并将响应发送回客户端。如果遇到 404，它必须尝试提供本地文件
python - 扭曲/执行异步http请求
我有一个扭曲的 react 堆监听传入的数据。我有第二个 react 器在特定时间间隔执行 http 请求，将结果发送到第一个 react 器。两者都运行良好。现在我想把它放在一起在一个 react
c# - ImageMagick 扭曲
我正在尝试使用 ImageMagick 的透视功能。我看过这些例子，但我无法理解值对应的是什么。我有这段代码: var stream = new MemoryStream(); using (Mag
algorithm - 根据形状的已知尺寸消除倾斜/扭曲
我有一个应用程序的想法，该应用程序采用每个角落有四个正方形的打印页面，并允许您在至少有两个正方形可见的情况下测量纸上的对象。我希望能够让用户从不太完美的角度拍照，但仍能准确测量物体。由于我在该领域缺
c# - 计算一个字符串的所有可能组合，扭曲
我试图让用户在文本框中输入文本，并让程序生成所有可能的组合，但最少 3 个字符和最多 6 个字符除外。我不需要像 ' 这样的无用词as'、'a'、'i'、'to' 等弄乱了我的阵列。我还将根据字典检查
algorithm - 查找数组中元素的最大总和(扭曲)
给定一个包含 +ve 和 -ve 整数的数组，找出不允许跳过 2 个连续元素的最大总和(即，您必须至少选择其中一个才能向前移动)。例如:- 10、20、30、-10、-50、40、-50、-1、-3
python - 扭曲:失败与错误
什么时候应该使用 twisted.python.failure.Failure，什么时候应该使用 twisted.internet.error.ConnectionDone？或者我应该做 twiste
Python 扭曲 : how to schedule?
在 Twisted 中有 1 天的经验，我尝试安排消息发送以回复 tcp 客户端: import os, sys, time from twisted.internet import protocol
Python 扭曲 : where to start
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
python - 扭曲:正确捕获键盘中断和关闭
更新:为了便于阅读，这里是如何在 react 器关闭之前添加回调: reactor.addSystemEventTrigger('before', 'shutdown', callable) 原始问题
Python - 扭曲、代理和修改内容
所以我已经查看了一些涉及使用 python 和 Twisted 框架编写 HTTP 代理的事情。基本上，就像其他一些问题一样，我希望能够修改将发送回浏览器的数据。也就是说，浏览器请求资源，代理将获取

首页

博学

6Ren·AI

商城

python - 扭曲的 Python getPage