gpt4 book ai didi

python - Scrapy 提取脚本值

转载 作者:太空宇宙 更新时间:2023-11-03 21:11:56 27 4
gpt4 key购买 nike

在特定网址上使用 scrapy shell 我试图确定如何从页面源代码中的脚本中提取作者值或贡献者值?我已经尝试过了

response.xpath('//script').re(r'author":"([0-9.]+)"') 

这是网站源代码中的脚本

<script charSet="UTF-8">...
"author":"3810161","contributor":{"id":"3810161"}},
</script>

最佳答案

您是否尝试打印所有 <script> Scrapy 本身的内容?我想您不会看到与导航检查器中看到的内容相同的内容,因为这些节点似乎是 Javascript 渲染的,而 Scrapy 不处理 Javascript。

如果您只想从这些搜索结果中提取一些内容,您可以使用 api (与您发布的搜索参数相同,但给您一个 JSON 响应,真的更容易解析...)

关于python - Scrapy 提取脚本值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55008581/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com