- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我试图了解块大小的影响以及在 DCT 压缩中选择系数的最佳策略。
基本上我想问一下我在这里写了什么:
Video Compression: What is discrete cosine transform?
让我们假设最原始的压缩。制作图像块。对每个博客执行 DCT 并将一些系数归零。
据我了解,块越小越好。
较小的块意味着像素更相关,因此 DCT 频谱中的能量更“紧凑”。在快速变化的图像(高频)中应该更加强调。
假设我们将一定百分比的系数归零,什么会导致最佳图像质量,小块还是大块?
假设我们保持 10%、25%、50%、75%,你会说这是不同百分比的不同答案吗?
另一个问题是如何选择保持不变的系数。
假设我必须根据位置而不是能量做出决定。
你会从左上角拿一个正方形吗?
我已经平均了 DCT 频谱中的许多块,并得出结论,最好的方法是从左上角取一个三角形。你怎么认为?
希望我们能进行有效的讨论。
最佳答案
您问题的本质似乎与图像质量有关。已经有大量关于该主题的文献,结果是图像质量很难确定。
像信噪比 (SNR) 和均方误差 (MSE) 这样的标准数学误差度量可以给出定量的答案,但众所周知,这些与主观观众意见的相关性不高,这必须是我们的最终权威。没有其他方法,即使是那些基于观看者心理视觉模型的方法(例如,SA Karunasekera 和 NG Kingsbury,“基于人类视觉敏感性的图像块伪影失真测量”,IEEE Trans. on Image Proc. vol. 4 ,第 6 期,1995 年 6 月,第 713 – 724 页;以及 M. Miyahara、K. Kotani 和 VR Algazi,“图像编码的客观图像质量等级 (PQS)”,IEEE Trans. on Comm. vol. 46, No. 9, Sept. 1998, pp. 1215 –1226),已经证明它们比 SNR 更好。
此外,当您改变图像类型(线条图、卡通、照片、肖像等)时,某些类型的压缩失真变得更加明显。蚊子噪声在一张图像中可能令人反感,而楼梯噪声可能是另一张图像的罪魁祸首。
简而言之,对于您的问题“什么会导致最佳图像质量?”没有轻而易举的答案。
话虽如此,我们可以说一些有关 DCT 的事情。块的 DCT 中的像素从左上角 [(0,0)->(0,1)->(1,0)->(2) 之字形图案中从低变化到高变化,0)->(1,1)->(0,2)->etc.],作为您的三角形选择镜像。一个像素离左上角越近,其中包含的信息越平滑[实际上,(0,0) DCT值就是整个块的平均值],离那个角越远,得到的信息就越平滑你会得到“高频”细节。越靠近图像的顶部和左侧,该 DCT 系数代表的水平和垂直细节越多,并且越靠近块的对角线,您将拥有的对角线细节越多。
简而言之,有损压缩通常需要丢弃一些肉眼无法察觉的“细节”。 (丢弃“更平滑”的 DCT 值会导致严重失真。)丢弃的 DCT 值越多,压缩比就越大,但也会引起更大的失真。
至于块大小,这一切都取决于。块中的差异和细节越多,丢弃系数的损失就越多。一些压缩算法在同一图像内自适应地使用不同的块大小,以便高细节区域接收更多和更小的块,而平滑区域接收更少和更大的块。
对于使用单个块大小的算法,8x8、16x16 和 32x32 是 JPEG 和 MPEG 等常见的算法。压缩它们所需的处理将小于自适应块大小,但质量通常也会较低。
关于image-processing - DCT 压缩 - block 大小,选择系数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1955663/
这个问题在这里已经有了答案: C sizeof a passed array [duplicate] (7 个回答) 8年前关闭。 在一个函数中,我声明了一个数组: int char_count_ar
简而言之,文件系统如何与 block 设备通信? 最佳答案 我对 block 大小不太了解。我认为 ext4(Linux)的文件系统的 block 大小是 4KB,考虑到现代处理器的页面大小(4KB)
我知道 tinyint(1) 和 tinyint(2) 具有相同的存储空间范围。 唯一的区别是显示宽度不同。这是否意味着 tinyint(1) 将存储所有类型的整数但只正确显示 0 到 9 的范围?而
今晚我已经研究了以下代码几个小时,但我只是摸不着头脑。 当使用函数从标准输入填充数组时,我不断收到“大小 8 的无效写入”和“大小 8 的无效读取”。 如有任何帮助,我们将不胜感激...我知道 Sta
我有一个 valgrind 错误,我不知道如何摆脱它们: ==5685== Invalid read of size 8 ==5685== at 0x4008A1: main (in /home
我对 Hadoop 的概念有点困惑。 Hadoop block 大小、拆分大小和 block 大小 之间有什么区别? 提前致谢。 最佳答案 block 大小和 block 大小相同。 拆分大小 可能与
我想不出一个好的标题,所以希望可以。 我正在做的是创建一个离线 HTML5 webapp。 “出于某些原因”我不希望将某些文件放在缓存 list 中,而是希望将内容放在 localStorage 中。
无法将 xamarin apk 大小减少到 80 MB 以下,已执行以下操作: 启用混淆器 配置:发布 平台:事件(任何 CPU)。 启用 Multi-Dex:true 启用开发人员检测(调试和分析)
我正在开发一个程序,需要将大量 csv 文件(数千个)加载到数组中。 csv 文件的尺寸为 45x100,我想创建一个尺寸为 nx45x100 的 3-d 数组。目前,我使用 pd.read_csv(
Hello World 示例的 React Native APK 大小约为 20M (in recent versions),因为支持不同的硬件架构(ARMv7、ARMv8、X86 等),而同一应用程
我有一个包含 n 个十进制元素的列表,其中每个元素都是两个字节长。 可以说: x = [9000 , 5000 , 2000 , 400] 这个想法是将每个元素拆分为 MSB 和 LSB 并将其存储在
如何设置 GtKTextView 的大小?我想我不能使用 gtk_widget_set_usize。 最佳答案 您不能直接控制小部件的大小,而是由其容器完成。您可以使用 gtk_widget_set_
这个问题在这里已经有了答案: c++ sizeof() of a class with functions (7 个答案) 关闭 5 年前。 结果是 12。 foobar 函数存储在内存中的什么位置
当我在 ffmpeg(或任何其他程序)中使用这样的命令时: ffmpeg -i input.mp4 image%d.jpg 所有图像的组合文件大小总是比视频本身大。我尝试减少每秒帧数、降低压缩设置、模
我是 clojurescript 的新手。 高级编译后出现“77 KB”的javascript文件是否正常? 我有一个 clojurescript 文件: 我正在使用 leinigen: lein c
我想要一个 QPixmap尺寸为 50 x 50。 我试过 : QPixmap watermark(QSize(50,50)); watermark.load(":/icoMenu/preparati
我正在尝试从一篇研究论文中重新创建一个 cnn,但我对深度学习还是个新手。 我得到了一个大小为 32x32x7 的 3d 补丁。我首先想执行一个大小为 3x3 的卷积,具有 32 个特征和步幅为 2。
我一直在尝试调整 View Controller 内的 View 大小,但到目前为止没有运气。基本上,我的 View 最底部有一个按钮,当方向从纵向更改为横向时,该按钮不再可见,因为它现在太靠下了。
如何使用此功能检查图像的尺寸?我只是想在上传之前检查一下... $("#LINK_UPLOAD_PHOTO").submit(function () { var form = $(this);
我用 C++ 完成了这个,因为你可以通过引用传递参数。我无法弄清楚如何在 JavaScript 中执行此操作。我的代码需要更改什么?我的输出是1 this.sizeOfBst = function()
我是一名优秀的程序员,十分优秀!