gpt4 book ai didi

python - 如何将输出转换为列表以计算其数量?

转载 作者:行者123 更新时间:2023-11-28 19:57:23 25 4
gpt4 key购买 nike

我写了一个脚本来解析网页并获取网页上的链接数量('a' 标签):

import urllib
import lxml.html
connection = urllib.urlopen('http://test.com')
dom = lxml.html.fromstring(connection.read())
for link in dom.xpath('//a/@href'):
print link

脚本的输出:

./01.html
./52.html
./801.html
http://www.blablabla.com/1.html
#top

如何将其转换为列表以计算链接数量?我使用 link.split() 但它让我明白了:

['./01.html']
['./52.html']
['./801.html']
['http://www.blablabla.com/1.html']
['#top']

但我想得到:

[./01.html, ./52.html, ./801.html, http://www.blablabla.com/1.html, #top]

谢谢!

最佳答案

link.split() 尝试拆分链接本身。但是您必须使用代表所有链接的实体。在您的情况下:dom.xpath('//a/@href')

所以这一定对你有帮助:

links = list(dom.xpath('//a/@href'))

并使用内置的 len 函数获取长度:

print len(links)

关于python - 如何将输出转换为列表以计算其数量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14583339/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com