gpt4 book ai didi

web-crawler - 爬取产品详细信息页面时动态分配列?

转载 作者:行者123 更新时间:2023-12-02 01:36:11 25 4
gpt4 key购买 nike

我是 import.io 和堆栈溢出的新手,请善待我。

我正在尝试抓取销售珠宝的在线商店的产品详细信息页面,并在该页面上找到此类功能列表:

特点

性别 男士

技术风格 quartz

Material 不锈钢

等等

是否可以训练爬虫动态提取粗体文本作为列名,而不是粗体文本作为列值?即“性别”列的值为“男性”等。假设在其他产品详细信息页面上,功能可能不以“性别”开头

感谢您的帮助!

最佳答案

我还没有尝试过这个,但我认为这些会起作用:

  1. 通过选择所有粗体文本来训练一列,并使用 xpaths 训练具有相应值的另一列。
  2. 将其全部作为一行进行训练,以便始终选择所有特征。

关于web-crawler - 爬取产品详细信息页面时动态分配列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31185448/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com