"和 ""之间的内容?-6ren"> "和 ""之间的内容?-HTML代码是这样的: head time:2013-08-13 place:new york source www.go-6ren">
gpt4 book ai didi

python - 如何通过 python sgmllib 或解析器获取 "
"和 "
"之间的内容?

转载 作者:太空宇宙 更新时间:2023-11-04 13:20:34 28 4
gpt4 key购买 nike

HTML代码是这样的:

    <div id="wrap">
<div id="content">

<h1>head</h1>
<ul class="jobpara">
<li class="floatl"><span>time:</span>2013-08-13</li>
<li class="floatl"><span>place:</span>new york</li>
<li class="floatl"><span>source </span>www.goole.com</li>
</ul>
</div>
</div>

如何获取 <div> 之间的内容和 </div>通过 Python sgmllib 或解析器?

最佳答案

from bs4 import BeautifulSoup
import urllib2

url="http://some-website.com/"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())

build_form = {}

for input_field in soup.findAll('input'):
if input_field['type'] in ('hidden', 'text', 'password', 'submit', 'image'):
if input_field.has_attr('name'):
value = ''
if input_field.has_attr('value'):
value=input_field['value']
build_form[input_field['name']] = value

print build_form

这是一个示例,说明如何使用 beautifulsoup 为您提供一个对象或某种特定类型的所有对象的“内部数据”。

关于python - 如何通过 python sgmllib 或解析器获取 "<div>"和 "</div>"之间的内容?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18208562/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com