gpt4 book ai didi

python - 使用 Mutagen 处理所有接受的文件类型

转载 作者:太空狗 更新时间:2023-10-30 00:45:23 24 4
gpt4 key购买 nike

我需要做什么才能处理 mutagen、.ogg、.apev2、.wma、flac、mp4 和 asf 接受的每种文件类型? (我排除了 mp3,因为它有最多的文档)

如果知道这是如何完成的人可以提供一些伪代码来解释所使用的技术,我将不胜感激。我想要提取的主要标签是文件的标题和艺术家,如果有专辑。

从哪里开始?

最佳答案

每种标签类型都有不同的字段名称,并且它们并非都完美映射。

如果您只想要一些最重要的字段,Mutagen 有针对 ID3v2 和 MP4/ITMF 的“简单”包装器。因此,例如,您可以这样做:

>>> m = mutagen.File(path, easy=True)
>>> m['title']
[u'Sunshine Smile']
>>> m['artist']
[u'Adorable']
>>> m['album']
[u'Against Perfection']

但这只适用于这两种文件格式。 Vorbis、Metaflac、APEv2 和 WMT 标签本质上是自由格式的键:值或键:[值列表] 映射。 Vorbis 确实有一个 recommended一组常见评论字段的名称,WM 有一组由 WMP GUI 和 .NET API 映射的字段,但 Metaflac 和 APEv2 甚至没有。事实上,在 Metaflac 评论中同时看到来自旧 ID3v1 字段名称的“艺术家”和来自 Vorbis 的“艺术家”是很常见的。

即使对于 ID3v2,映射也不完美——iTunes 将“TPE1”框架显示为“艺术家”,将“TPE2”显示为“专辑艺术家”,而 Foobar2000 将 TPE2 显示为“艺术家”,将 TXXX:ALBUM ARTIST 显示为“专辑艺术家”。

因此,要正确执行此操作,您必须查看 iTMF , Vorbiscomment , ID3v2 (或参见 Wikipedia )和 WMT ,然后查看您拥有的文件并添加一些启发式方法来决定如何从您拥有的文件中获取您想要的内容。

例如,您可以尝试这样的操作:

>>> m = mutagen.File(path)
>>> for tag in ('TPE1', 'TPE2', u'©ART', 'Author', 'Artist', 'ARTIST',
... 'TRACK ARTIST', 'TRACKARTIST', 'TrackArtist', 'Track Artist'):
... try:
... artist = unicode(m[tag][0])
... break
... except KeyError:
... pass

更好的解决方案是打开标签类型并只尝试格式的适当字段。

幸运的是,其他人已经为您完成了这项工作。您可以在 Hydrogen Audio 找到人们收集的几乎所有关于不同播放器/标记器如何将值映射到每种格式的信息。论坛和 wiki,以及各种其他项目已将这些信息转化为简单的标签映射表,您可以拿起这些表并为您的代码借用,例如 this one来自 MusicBrainz。 MusicBrainz Picard甚至有一个围绕 Mutagen 的包装器,它允许您对所有标签类型使用一组一致的元数据名称(描述的 here )。

关于python - 使用 Mutagen 处理所有接受的文件类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19193551/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com