javascript - 接收预请求而不是想要的请求-6ren

javascript - 接收预请求而不是想要的请求

转载作者：行者123 更新时间：2023-11-30 20:39:15

25

4

下面的函数对以下链接执行一个简单的请求:
http://patorjk.com/software/taag/#p=display&f=Graffiti&t=test

我只想得到那些大 ACSII 字母中的测试消息“test”。

但是，出于某种原因，我要查找的输出文本 不在协议(protocol)中保存的 HTML 代码中。如果我复制并粘贴链接并检查 HTML 代码而不是使用 Google Chrome，则输出文本是可见的。

我似乎只收到尚未生成正文部分的预请求。如何获得生成output_text 的“正确”HTML 源代码？

下面是:

Python 代码
通过请求收到的 HTML 代码
通过 chrome 手动检查页面时的 HTML 代码

1。 Python代码

from bs4 import BeautifulSoup
import requests

def scrape():
    """Scrape from http://patorjk.com

    Crucial section looks like:

        <pre id="taag_output_text" style="float:left;" class="fig" contenteditable="true">
        STRING STRING STRING STRING
        STRING STRING STRING STRING
        </pre>
    """

    URL = "http://patorjk.com/software/taag/#p=display&f=Graffiti&t=TEST"

    with requests.Session() as c:
        source = c.get(URL)

    soup = BeautifulSoup(source.text, "lxml")

    with open("protocol.txt", "w") as file:
        file.write(soup.prettify())

    text = soup.find("pre", id_="taag_output_text")

    if not(text):
        print("Error: output text not found.")

    return text

2。通过请求的 HTML 代码

  <div id="maincontent">
   <div id="outputFigDisplay">
   </div>

3。人工检查HTML代码

<div id="maincontent">
    <div id="outputFigDisplay" class="fig">
        <pre id="taag_output_text" style="float:left;" class="fig" contenteditable="true">  __                   __   
        _/  |_  ____   _______/  |_ 
        \   __\/ __ \ /  ___/\   __\
         |  | \  ___/ \___ \  |  |  
         |__|  \___  >____  > |__|  
                   \/     \/        
        </pre>
        <div style="clear:both"></div>
    </div>
</div>

最佳答案

如评论中所述，文本由客户端的 js 生成，因此无法使用 requests 和 bs4 抓取它，但您可以使用运行 js 的客户端，例如 selenium :

from selenium import webdriver

url = "http://patorjk.com/software/taag/#p=display&f=Graffiti&t=TEST"
driver = webdriver.Firefox()
driver.get(url)
element = driver.find_element_by_id("taag_output_text")
text = element.text
driver.close()

print(text)

或者，您可以从 http://www.network-science.de/ascii/ 获得相同的 ASCII 艺术，无需使用 selenium

import requests
from bs4 import BeautifulSoup

url = "http://www.network-science.de/ascii/ascii.php?TEXT=TEST&FONT=graffiti&RICH=no&FORM=left&STRE=no&WIDT=80"
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
text = soup.find_all('pre')[1].text

print(text)

两种方法产生相同的结果:

______________________ ____________________
\__    ___/\_   _____//   _____/\__    ___/
  |    |    |    __)_ \_____  \   |    |
  |    |    |        \/        \  |    |
  |____|   /_______  /_______  /  |____|
                   \/        \/

关于javascript - 接收预请求而不是想要的请求，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49472939/

25

4

0

文章推荐： c - 一个字节变量如何存储两个字节字符常量？

文章推荐： c - 无需gdb的linux应用程序远程调试

MPI 接收/收集动态矢量长度
我有一个存储结构向量的应用程序。这些结构保存有关系统上每个 GPU 的信息，如内存和 giga-flop/s。每个系统上有不同数量的 GPU。我有一个程序可以同时在多台机器上运行，我需要收集这些数据
MPI 非阻塞发送/接收
我很好奇 MPI 中缺少此功能: MPI_Isendrecv( ... ); 即，非阻塞发送和接收，谁能告诉我其省略背后的基本原理？最佳答案我的看法是 MPI_SENDRECV存在是为了方便那些想
c - 接收/接收的最大镜头数是多少
当我用以下方法监听TCP或UDP套接字时 ssize_t recv(int sockfd, void *buf, size_t len, int flags); 或者 ssize_t recvfrom
java - 如何推迟事件触发/接收
SUM:如何在 azure 事件网格中推迟事件触发或事件接收？我设计的系统需要对低频对象状态(创建、启动、检查长时间启动状态、结束)使用react。它看起来像是事件处理的候选者。我想用azure函数
来自未知来源的 MPI 接收
我正在 MPI 中实现一个程序，其中主进程(等级 = 0)应该能够接收来自其他进程的请求，这些进程要求只有根才知道的变量值。如果我按等级 0 进行 MPI_Recv(...)，我必须指定向根发送请求的
c++ - WM_CLOSE事件从不发送/接收？
我正在学习DX12，并在此过程中学习“旧版Win32”。我在退出主循环时遇到问题，这似乎与我没有收到WM_CLOSE消息有关。在C++，Windows 10控制台应用程序中。 #include
java - 如何推迟事件触发/接收
SUM:如何在 azure 事件网格中推迟事件触发或事件接收？我设计的系统需要对低频对象状态(创建、启动、检查长时间启动状态、结束)使用react。它看起来像是事件处理的候选者。我想用azure函数
java - 我如何处理短信发送/接收？
我想编写方法来通过号码发送短信并使用编辑文本字段中的文本。发送消息后，我想收到一些声音或其他东西来提醒我收到短信。我怎样才能做到这一点？先感谢您，狼。最佳答案这个网站似乎对两者都有很好的描述:ht
java - 接收/发送数据报套接字数据
所以我正在用 Java 编写一个程序，在 DatagramSocket 和 DatagramPacket 的帮助下发送和接收数据。问题是，在我发送数据/接收数据之间的某个时间 - 我发送数据的程序中的
java - 构建相机应用程序 - 接收
我是 Android 编程新手，我正在用 Java 编写一个应用程序，该应用程序可以打开相机拍照并保存。我通过 Intents 做到了，但看不到 onActivityResult 正在运行。我已经在
c++ - 一个套接字在线程中发送/接收
我有一个套接字服务器和一个套接字客户端。客户端只有一个套接字。我必须使用线程在客户端发送/接收数据。 static int sock = -1; static std::mutex mutex; vo
c - 数据未正确发送/接收
我正在尝试使用 c 中的套接字实现 TCP 服务器/客户端。我以这样的方式编写程序，即我们在客户端发送的任何内容都逐行显示在服务器中，直到键入退出。该程序可以运行，但数据最后一起显示在服务器中。有人可
c - 接收 AT 命令
我正在使用微 Controller 与 SIM808 模块通信，我想发送和接收 AT 命令。现在的问题是，对于某些命令，我只收到了我应该收到的答案的一部分，但对于其他一些命令，我收到了我应该
c - 接收 SIGTERM
我用c设计了一个消息传递接口(interface)，用于在我的系统中运行的不同进程之间提供通信。该接口(interface)为此目的创建 10-12 个线程，并使用 TCP 套接字提供通信。它工作正
c - 在套接字中发送多个发送/接收
我需要澄清一下在套接字程序中使用多个发送/接收。我的客户端程序如下所示(使用 TCP SOCK_STREAM)。 send(sockfd,"Messgfromlient",15,0);
c++ - 多线程多套接字同时发送/接收
我正在构建一个真正的基本代理服务器到我现有的HTTP服务器中。将传入连接添加到队列中，并将信号发送到另一个等待线程队列中的一个线程。此线程从队列中获取传入连接并对其进行处理。问题是代理程序真的很慢。
json - 接收 JSON 帖子
我正在使用 $routeProvider 设置一条类似的路线 when('/grab/:param1/:param2', { controller: 'someController',
nginx - 接收 HLS 流并重播
我在欧洲有通过 HLS 流式传输的商业流媒体服务器。http://europe.server/stream1/index.m3u8现在我在美国的客户由于距离而遇到一些网络问题。所以我在美国部署了新服
django - 接收 celery 任务中的事件
我有一个长期运行的 celery 任务，该任务遍历一系列项目并执行一些操作。任务应该以某种方式报告当前正在处理的项目，以便最终用户知道任务的进度。目前，我的django应用程序和celery一起坐
Odoo Controller 接收 blob
我需要将音频文件从浏览器发送到 python Controller 。我是这样做的: var xmlHttp = new XMLHttpRequest(); xmlHttp.open( "POST",

首页

博学

6Ren·AI

商城

javascript - 接收预请求而不是想要的请求

1。 Python代码

2。通过请求的 HTML 代码

3。人工检查HTML代码