gpt4 book ai didi

python - 使用portia(scrapy)从网站提取元标签

转载 作者:太空宇宙 更新时间:2023-11-04 07:19:14 25 4
gpt4 key购买 nike

使用 portia (scrapy) 从网站中提取 Meta 标签

我想使用 portia 从某些网站提取元标记,但它不显示 head 标记,它仅从 body 标记开始

我只能从正文标签中提取数据

最佳答案

您需要在 body 中注释一个元素,然后导航到要映射的 head 中的元素。

  1. 注释页面上的一个元素,哪个元素都无关紧要。
  2. 在注释弹出窗口或右侧工具箱的注释面板中单击设置图标。
  3. 单击html 元素。您将收到一条警告,提示您将丢失任何映射到注释的属性,单击“确定”。
  4. 再次单击设置图标,这次选择 head 元素。
  5. 再次单击设置图标,您可以在 head 中选择子元素。
  6. 选择元素后,单击 + Field 按钮创建一个新字段,然后将所需的属性值映射到目标字段。

另请参阅:https://github.com/scrapinghub/portia/issues/60

关于python - 使用portia(scrapy)从网站提取元标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27165691/

25 4 0