gpt4 book ai didi

python - 提取 HTML 表单的字段名称 - Python

转载 作者:太空狗 更新时间:2023-10-30 03:06:53 25 4
gpt4 key购买 nike

假设有一个链接“http://www.someHTMLPageWithTwoForms.com”,它基本上是一个具有两种表单(比如表单 1 和表单 2)的 HTML 页面。我有这样的代码......

import httplib2
from BeautifulSoup import BeautifulSoup, SoupStrainer
h = httplib2.Http('.cache')
response, content = h.request('http://www.someHTMLPageWithTwoForms.com')
for field in BeautifulSoup(content, parseOnlyThese=SoupStrainer('input')):
if field.has_key('name'):
print field['name']

这会返回属于我的 HTML 页面的 Form 1 和 Form 2 的所有字段名称。有什么方法可以只获取属于特定表单的字段名称(例如仅表单 2)?

最佳答案

如果只有 2 种形式,你可以试试这个:

from BeautifulSoup import BeautifulSoup

forms = BeautifulSoup(content).findAll('form')
for field in forms[1]:
if field.has_key('name'):
print field['name']

如果它不仅仅是关于第二种形式,你可以让它更具体(通过 id 或 class 属性

from BeautifulSoup import BeautifulSoup

forms = BeautifulSoup(content).findAll(attrs={'id' : 'yourFormId'})
for field in forms[0]:
if field.has_key('name'):
print field['name']

关于python - 提取 HTML 表单的字段名称 - Python,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6910985/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com