gpt4 book ai didi

python - beautiful soup 通过指定两件事在表中查找链接

转载 作者:行者123 更新时间:2023-12-01 09:17:27 27 4
gpt4 key购买 nike

我如何获得结果网址:https://www.sec.gov/Archives/edgar/data/1633917/000163391718000094/0001633917-18-000094-index.htm

...从此页面...

https://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=0001633917&owner=exclude&count=40

...通过指定 date = '2018-04-25 并且我想要 8-k 进行归档?我是循环还是有一个单行代码可以得到结果?

from bs4 import BeautifulSoup
from bs4.element import Comment
import requests

date='2018-04-25'
CIK='1633917'

url = 'https://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=' + CIK + '&owner=exclude&count=100'
r = requests.get(url)
soup = BeautifulSoup(r.text,'html.parser')
a=soup.find('table', class_='tableFile2').findAll('tr')
for i in a:
print i

最佳答案

没有任何一个类轮代码可以满足您的需求。您必须循环遍历行,然后检查值是否匹配。

但是,有一种稍微更好的方法可以缩小行范围。您可以直接选择与其中一个值匹配的行。例如,您可以选择所有包含 date = '2018-04-25' 的行,然后检查归档是否匹配。

代码:

for date in soup.find_all('td', text='2018-04-25'):
row = date.find_parent('tr')
if row.td.text == '8-K':
link = row.a['href']
print(link)

输出:

/Archives/edgar/data/1633917/000163391718000094/0001633917-18-000094-index.htm

因此,在这里,您只需循环具有所需日期的行,而不是循环所有行。在这种情况下,只有一个这样的行,因此我们只循环一次。

关于python - beautiful soup 通过指定两件事在表中查找链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51111772/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com