Issue with extracting data from javascript generated html doc(从javascript生成的html文档中提取数据的问题)-6ren

Issue with extracting data from javascript generated html doc(从javascript生成的html文档中提取数据的问题)

转载作者：bug小助手更新时间：2023-10-22 16:38:50

I'm trying to parse info from this page https://fem.encar.com/cars/detail/35902422?wtClick_index=187&conType=pctom
The data I need is in the following part of html:

我正在尝试分析此页面中的信息https://fem.encar.com/cars/detail/35902422?wtClick_index=187conType=pctom我需要的数据在html的以下部分：

<span class="DetailSummary_num_graph__oN21B">
<span>82%</span>
</span>

I need to get this 82%.

我需要得到这个82%。

I've saved html file with following function:

我用以下函数保存了html文件：

async def discount(folder):
    url = f"https://fem.encar.com/cars/detail/35902422?wtClick_index=187&conType=pctom"
    headers = {
        "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36",
    }

    async with aiohttp.ClientSession() as session:
        async with session.get(url=url, headers=headers) as response:
            data = await response.text()
            if not os.path.exists(folder):
                os.makedirs(folder)
            with open(f"{folder}\html.html", "w", encoding="utf8") as file:
                file.write(data)

However, the html doc saved doesn't have the info I need which I see on the browser. Please help me find this data in json or other type of files on this webpage

然而，保存的html文档没有我在浏览器上看到的所需信息。请帮助我在此网页上的json或其他类型的文件中找到这些数据

更多回答

while <span class="DetailSummary_num_graph__oN21B" does exist in that document, that span does not contain a span, it just contains -% - anyway, if the data is retrieved dynamically, then you'll need a browser to view the dynamic data - clearly that site is made to deter web scrapping

虽然

优秀答案推荐

更多回答

28 4 0

文章推荐： The breakpoint will not currently be hit. Unbound breakpoint(当前不会命中断点。未绑定断点)

文章推荐： PCL not finding QHull includes(PCL未找到QHull包含)

文章推荐： Using Python to automate creation of JIRA tickets(使用Python自动创建JIRA票证)

文章推荐： merge 2 tables with multiple conditions using pd.merge function [duplicate](使用pd.merge函数[重复]合并具有多个条件的2个表)

generator - 试图找到一种方法来构造 Julia `generator`
我是 Julia 的新手。我主要用python编程。在 python 中，如果你想迭代大量的值，通常构造一个所谓的生成器来节省内存使用。这是一个示例代码: def generator(N):

android - 生成签名的 apk。错误 :(7) [MissingTranslation] in build/generated/res/generated/release/values/generated. xml
这个问题很奇怪。我试图直接在 build.gradle 中添加一个字符串，因为我需要它来使用 Tray 库 ( https://github.com/grandcentrix/tray )。在我的第一

generator - Symfony3 : Generate crud doesn't work
我正在尝试在我的新 symfony3 项目中使用生成 CRUD 功能。我创建了一个名为 AdminBundle 的 bundle ，其中包含生成器、实体测试以及生成器，所有这些都处理得很好。我检查了我

javascript - 迭代 Generator 并返回 Generator
我尝试理解生成器，但我发现了一个我无法遵循的示例。 // First Generator function* Colors () { yield "blue"; yield* MoreColo

procedural-generation - 数学题: procedural generation of a galaxy
我将制作一款完全由程序生成的空间/交易/战斗游戏。但是，我知道将整个星系的所有细节存储在内存中是不可行的。因此，我一直认为我可以使用种子来生成太阳系，并且从该太阳系，您可以使用跳跃门前往其他太阳系。问

generator - MyBatis Generator 删除 useGenerateKeys ="true"
我在 Eclipse Helios 中使用 MyBatis Generator (MyBatis Generator 1.3.1.201101032122)，但每次我自动生成持久类时，生成器都会删除属

Java注解处理: reference generated type in other generated code
@GenerateInterface class A {} @GenerateInterface class B { void setA(IA a) {} } 我的注释处理器应该生成这些接口(in

npm - require ('yeoman-generator' ).generators.Base 已弃用
我刚刚在一个空目录中安装了 yeoman，它打印出一个错误。这就是我所做的: npm i yo -g npm i generator-webapp -g 之后我抛出一个错误: require('yeo

pdf-generation - 当表格在页面上拆分时，NReco PDF Generator 重叠表格标题
我正在使用 NReco PDFGenerator 从 HTML 字符串创建 PDF 文档。当表格被分页符拆分时，表格标题与表格中的下一行重叠(见下图)。有想法该怎么解决这个吗？最佳答案我发现这是

ruby-on-rails - RoR3 : How do I use the generator to generate views?
我有这个命名空间: namespace :manage do # Directs /manage/products/* to Manage::ProductsController

openapi-generator - 无法从 openapi-generator mustache 模板引用供应商扩展
我有一个 Open API 3 规范的 yaml 文件，它有一些 x- 前缀的属性。我正在尝试使用 openapi-generator-cli 生成一个 Angular Typescript SDK。

php - `yield from $generator` 和 `return $generator` 之间的区别？
我有一个返回生成器的函数。目前它使用yield from: function foo() { $generator = getGenerator(); // some other st

Symfony2s Doctrine :generate:entities doesn't generate repo classes
我选择Symfony2 docs 。据说添加 /** * @ORM\Entity(repositoryClass="Acme\StoreBundle\Entity\ProductRepository

ruby-on-rails - "rails generate"创建新的 "generate"项目？
运行命令生成新的 rails 项目: $ rails generate controller home index 以上将创建四个新的 Rails 项目:generate、controller、hom

java - 高 Perm Generation 和低 Old Generation
我们实际上已经将jvm内存增加到了256M，现在老年代看起来很小，但Perm Generation相当高，接近80%。通过 jstat 捕获的示例数据如下。高永久代意味着什么？ Timestamp

ruby - self.generate 和 Invoice.generate 有什么区别？
class Invoice def Invoice.generate(order_id, charge_amount, credited_amount = 0.0) Invoice.new

angularjs - generator-angular 和 generator-angular-fullstack 之间有什么关系？
我在写 this comparison为了帮助人们理解所有这些废话，目前看来，generator-angular 的好处和值(value)只是您使用 generator-angular-fullsta

openapi-generator - 使用 openapi-generator 生成客户端时如何覆盖服务器 -> url (basepath)？
我有一个包含以下代码段的 OpenAPI 规范文档(我无法控制): servers: - url: http://www.[someservice].com/api 我正在使用这个 OpenAPI

openapi-generator - 如何使用 openAPI Generator 和 Maven 跳过支持和元数据文件的生成？
我正在使用 openapi-yaml 将 swagger 文件转换为开放的 API v3 文件。使用 Maven 生成器。我想做的是将新文件直接放入某个目录。但是会生成一些我不需要的其他文件，例如

javascript - Yeoman Generator - 如何解析 Generator 项目的 Package.json
我的生成器中有以下标准文件夹结构。我当前正在努力解决的任务是我目前有一个模板化的 _package.json ，我将其写入磁盘以用于主要生成。我想在编写的 package.json 中包含一个变量，它

bug小助手

个人简介
我是一名优秀的程序员,十分优秀！

作者热门文章

Python - failed to import external python program under different folder(Python-无法在不同文件夹下导入外部Python程序)

C# commandline parser : produces BadFormatConversionError when a bool option is given without value(C#命令行解析器：当给定一个没有值的bool选项时，会产生BadFormatConversionError)

Get primary table entries where the latest secondary entry was 6 months ago(获取6个月前最新辅助条目所在的主表条目)

Can't change the src of un image in javascript in django(无法更改django中javascript中un-image的src)

滴滴打车优惠券免费领取

全站热门文章

巧用mask属性创建一个纯CSS图标库

Java代码覆盖率super-jacoco

armmattermost

Vulnhub经典靶机：from_sqli_to_shell_i386入门靶机

【Rive】波动文字

Vscode实现应用qss样式表

DocforDevNow

干掉EasyExcel！FastExcel初体验

爬虫自动化脚本+AI赋能

快手后端面试，被面试官秒挂了！

首页

博学

6Ren·AI

商城

Issue with extracting data from javascript generated html doc(从javascript生成的html文档中提取数据的问题)