gpt4 book ai didi

xml - 将播客 xml 文件的标题写入与项目 GUID 匹配的文本文件 (linux)

转载 作者:太空宇宙 更新时间:2023-11-04 12:31:41 25 4
gpt4 key购买 nike

我想获取一个网络托管的 xml 播客文件并循环遍历,将所有标题放入与 guid 匹配的 txt 文件中,即 abcd.mp3.txt(或 abcd.txt) 将包含 This is the title

<rss xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd" version="2.0">
<channel>
<item>
<title>This is the title</title>
<enclosure url="http://www.example.com/abcd.mp3" length="402024" type="audio/mpeg"/>
<guid>http://www.example.com/abcd.mp3</guid>

我已经解决了这个问题并查看了 xmlstarlet、xmlgrep、xmlsh。然后是像 Osmosis 这样的东西,它看起来很强大但需要节点并且缺乏实用的文档。理想情况下使用尽可能少的外部依赖项(尽管安装了 Python 3.6)。

经过一个上午的思考,我开始怀疑自己是不是想多了/把事情复杂化了。任何指点表示赞赏。

最佳答案

好吧,在对样式表进行了多次修改之后,我偶然发现了 BeautifulSoup。

答案就这么简单(HT to this guide)

pip install bs4
pip install lxml

然后

#! /usr/bin/env python3
from bs4 import BeautifulSoup
import requests
url = 'http://www.example.com/somepodcast.xml'
content = requests.get(url).content
soup = BeautifulSoup(content,'lxml') # choose lxml parser
titles = soup.find_all('title')
for title in titles:
print(title) # or do whatever.

感谢其他建议,但这对我有用,因为它不会混淆 xpaths、regex 等。

关于xml - 将播客 xml 文件的标题写入与项目 GUID 匹配的文本文件 (linux),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43117641/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com