gpt4 book ai didi

python - 使用scrapy从阿里巴巴抓取标题

转载 作者:行者123 更新时间:2023-12-01 09:07:42 25 4
gpt4 key购买 nike

我想从此链接中删除此页面的标题,即义乌市珠宝有限公司:https://www.alibaba.com/energy-jewelrys-suppliers.html

html 代码片段是:

 <a target="_blank" title href="//cnmj.en.alibaba.com/company_profile.html#top-nav-bar" data-hislog="230670293" data-domdot="id:2638,sid:230670293">Yiwu City MJ <strong>Jewelry</strong> Co., Ltd.</a>

我有这个代码:

response.xpath('//*[@class="title ellipsis"]/a/text()').extract()

但是输出是:

['Yiwu City Mj ',
' Jewelery',
'Co. Ltd.']

问题是它应该是列表中的单个项目而不是多个项目。我怎么做?谢谢

最佳答案

您得到此信息是因为 a 中的子 strong 标记。

要解决此问题,您可以尝试。

"".join(response.xpath('//*[@class="title ellipsis"]/a//text()').extract())

希望这对解决问题有所帮助。

关于python - 使用scrapy从阿里巴巴抓取标题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51913365/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com