gpt4 book ai didi

python - 在python中打开txt文件中的链接

转载 作者:太空宇宙 更新时间:2023-11-03 16:25:28 26 4
gpt4 key购买 nike

我想寻求有关 RSS 程序的帮助。我正在做的是收集包含我的项目相关信息的网站,然后检查它们是否有 rss 提要。链接存储在txt文件中(每行一个链接)。所以我有一个 txt 文件,其中包含所有需要检查 rss 的基本 url。

我找到了这段代码,它将使我的工作变得更加轻松。

import requests  
from bs4 import BeautifulSoup

def get_rss_feed(website_url):
if website_url is None:
print("URL should not be null")
else:
source_code = requests.get(website_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text)
for link in soup.find_all("link", {"type" : "application/rss+xml"}):
href = link.get('href')
print("RSS feed for " + website_url + "is -->" + str(href))

get_rss_feed("http://www.extremetech.com/")

但我想从 txt 文件中打开我收集的网址,而不是逐一输入。

所以我尝试用这个来扩展程序:

from bs4 import BeautifulSoup, SoupStrainer

with open('test.txt','r') as f:
for link in BeautifulSoup(f.read(), parse_only=SoupStrainer('a')):
if link.has_attr('http'):
print(link['http'])

但是返回错误,指出 beautifulsoup 不是 http 客户端。

我还对此进行了扩展:

def open()
f = open("file.txt")
lines = f.readlines()
return lines

但这给了我一个用“,”分隔的列表

如果有人能够帮助我,我将非常感激

最佳答案

通常你会做这样的事情:

with open('links.txt', 'r') as f:
for line in f:
get_rss_feed(line)

此外,定义名为 open 的函数也是一个坏主意,除非您打算替换内置函数 open

关于python - 在python中打开txt文件中的链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38022010/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com