- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在开发一个应用程序,要求提交给它的图像是无损的。目前我正在使用 PIL 打开图像并检查“格式”属性是否为无损格式。这需要我手动保留格式列表,而且我不知道,例如,提交的 jpeg 是否恰好应用了无损变体。
import PIL
import PIL.Image
def validate_image(path):
img = PIL.Image.open(path)
if not img.format.lower() in ['bmp', 'gif', 'png', ...]:
raise Exception("File %s has invalid image format %s" % (path, img.format))
有没有更好的方法来检查图像文件是否无损?
最佳答案
我想我现在明白了:您想通过 PIL 打开图像。您想要拒绝有损图像,因为您正在进行某种需要所有丢失数据的科学处理,因为对人类视觉处理不重要的信息对您的算法很重要。
PIL 在顶层没有任何类型的接口(interface)来区分不同类型的压缩。你可以进入图像解码器并假设任何使用“原始”解码器的东西都是无损的,但即使你想这样做,那也太有限了——它会排除 GIF、LZW-压缩的 TIFF 等以及 JPEG、JPEG 压缩的 TIFF 等。
请记住,真正的问题在于消息传递和文档——管理用户期望。检查有损图像实际上只是一种启发式方法,一种捕捉更明显错误并提醒用户要求是什么的方法。因此,您不需要完美的东西,但拥有非常好的东西无论如何都会有所帮助。
所以,只有几个选项,都不是很好:
破解 PIL 的解码器源以保留编码信息并将其向上传递到顶层。显然,这需要在 30 个不同的导入器中进行一些不平凡的工作,可能涉及 C 和 Python,并且它会产生一个补丁,您必须针对(缓慢)发展的代码库进行维护——尽管当然,您始终可以将它提交到上游,并希望它能进入 PIL 的 future 版本。
深入研究解码器本身以获取运行时的信息。你能真正找到的唯一半标准的东西是他们使用原始解码器还是位解码器,这根本没有用(许多无损格式需要位解码器),所以你可能最终会阅读所有 30进口商并编写十几段代码以从中提取信息。
将另一个库与(或代替)PIL 一起使用。例如,虽然 ImageMagick 绝对不比 PIL 容易得多,但它确实有一个 API 可以告诉您图像文件使用的压缩类型。基本上,如果它是 UndefinedCompression
或 JPEGCompression
它是有损的,除此之外,它是无损的。主要缺点(除了需要安装两个图像库之外)是会有 PIL 可以打开但 IM 不能打开的文件,反之亦然,以及 PIL 和 IM 处理不同的多图像文件,等等。
做你已经在做的事。通读 30 个导入器,列出哪些是有损的,哪些是无损的。要处理有时无损的 JPEG 和 TIFF 等情况,您可能希望编写的代码不会完全拒绝它们,而是发出警告说“这些文件可能有损。您确定要导入它们吗? “(或者,或者,只为所有有损格式提供“我知道我在做什么”覆盖,然后只考虑 JPEG 和 TIFF 有损格式。)
对于许多用例,我会非常谨慎地选择 #4,但对于您的用例,它实际上似乎很合理。您不会因为您的代码会崩溃,或者出于安全原因或类似原因而试图阻止有损图像;您只是想警告人们,如果他们提交 JPEG,他们将浪费大量时间获取无用信息,对吧?
关于python - 在 Python 中检查图像格式是否无损?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14948505/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!