python - Beautifulsoup 从无序列表中提取文本和链接 div

python - Beautifulsoup 从无序列表中提取文本和链接 div < ul

转载作者：搜寻专家更新时间：2023-10-31 08:32:45

26

4

我试图从此网页的左侧提取城市名称 (http://www.silvan.dk/butikker)。原因是我需要提取每个城市的物理地址(在链接指向的页面上可以找到，但是，我暂时开始提取城市名称)。更准确的说是从这个容器。然而，由于我才刚刚开始使用 Python 和 Beautifulsoup，所以我无法提取想要的信息。

结果应该给我:城市，城市链接。

到目前为止我有:

import urllib2
import sys, locale, os, re
import lxml.etree
from bs4 import BeautifulSoup

def cp65001(name):
if name.lower() == 'cp65001':
    return codecs.lookup('utf-8')

html_page = urllib2.urlopen("http://www.silvan.dk/butikker",'w')
soup = BeautifulSoup(html_page)
li = soup.select("ul > li > a")
for link in li:
    print link.get('href')

这给了我以下输出:

#1
#2
#3
#4    
#5
#6
#7
#8
#9    
#10
#11
#12
#13
#14    
#15
#16
#17
#18

如果有人能指导我找到解决方案，我将不胜感激。我厌倦了使用

div = soup.find('div', id='leftContent')
lis = div.find_all('li')
num_lis = len(lis)

但是运行一圈就停止工作了，我不知道为什么？感谢您的宝贵时间。

最佳答案

更改您的选择器:

li = soup.select("ul > li > a")

到:

li = soup.select(".subMenu li a")

输出:

http://www.silvan.dk/butikker/ballerup
http://www.silvan.dk/butikker/birkeroed
http://www.silvan.dk/butikker/city2
http://www.silvan.dk/butikker/esbjerg
http://www.silvan.dk/butikker/fisketorvet
http://www.silvan.dk/butikker/fredericia
http://www.silvan.dk/butikker/frederikshavn
etc

您可以找到非常好的选择器文档 here

关于python - Beautifulsoup 从无序列表中提取文本和链接 div < ul <li (斯堪的纳维亚字符)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/19267175/

26

4

0

文章推荐： ios - 如何使用自定义键盘 iOS 发送图像

文章推荐： html - Iframe 相对路径挑战

文章推荐： objective-c - Swift 在 Objective C 中的 "if let"等价物

文章推荐： swift - 如何解决 Swift 不支持一流元类型的问题？

jQuery:仅选择 ul，而不选择 ul ul
我正在尝试使用 jQuery 来提交一个基本的 Accordion 样式菜单。这是菜单: http://www.cybart.com/bscg/ 这是为其提供 Accordion 功能的代码片段:
html - 增加嵌套 (ul ul ul li) 下拉导航列表项的宽度
这是我的网站: http://www.simply-a-christian.com/index.html 在导航栏上，如果您移动到: 信念玛丽安教义您可以看到每个 Marian Dogma(列出了
jquery - 当 ul ul 活跃时 ul parent 移动
这可能是一个很容易回答的问题，但是，我找不到解决方案。我已经建立了一个非常简单的菜单，每当我将鼠标悬停在 ul 父项上时，它的子项 ul ul 就会变得可见。基本上它是有效的，但 parent 让位于
HTML 下拉菜单 : "nav ul ul ul li" Too Low
这是一张图片: 问题是(你可以看到):“页面”按钮太低，无法点击。我想要的是它应该靠近“联系人”。现在是代码: HTML Home About
jquery - 如何在不破坏每个

首页

博学

6Ren·AI

商城