本套课件源自斯坦福大学经典课程:EE368/CS232: Digital Image Processing。
该课件内容体系完备、专业度顶尖,是面向高年级学生与行业工程师的高质量讲义资料,区别于普通课堂笔记,其编排精心、内容扎实,专业水准远超多数本科课程课件。
能够帮助学习者系统梳理图像处理知识脉络,透彻理解图像与视频处理领域的核心原理。
完整课件下载地址:
https://web.stanford.edu/class/ee368/index.html
我会逐页研究学习本套课件,并结合个人理解录制成讲解视频。部分内容会在原版基础上进行调整和拓展,课件资料及学习要点也将随视频同步更新。若讲解存在疏漏或不当之处,欢迎大家批评指正。
点运算是对图像中每个像素的灰度值进行独立的数学映射变换,输出像素的取值仅由对应输入像素的灰度值决定,不依赖于图像中其他像素的信息。具体内容包括:
比特数与画质正相关:比特数越高,灰度级越丰富,图像细节和过渡越平滑,文件体积也越大。反之,比特数越低,灰度级越少,画质越粗糙,文件体积越小。伪轮廓效应的触发点:当比特数降低到一定程度,就会出现明显的伪轮廓,图像中原本平滑的亮度变化会被强制阶梯化,严重影响画质。对于大多数应用,8比特是性价比最高的选择。对于画质要求较低的场景,比如简单的扫描文档,1比特的二值图像就足够使用。人眼的亮度感知遵循:
● :当前亮度
● :人眼刚好能察觉的亮度差
● :韦伯分数,对亮度来说约为 (1%~2%)
韦伯定律描述了人类感知差异的基本规律:人对刺激变化的察觉能力,与刺激的初始强度成正比。费希纳定律进一步指出:人眼对亮度的主观感知在对数域上是均匀的。这意味着主观亮度感受与物理亮度的对数成正比,而非线性关系。这也是为什么图像处理常常在对数空间处理,就是为了匹配人眼的感知特性。
两个连续量化级在可见度阈值下的亮度比率公式:
给定韦伯分数与量化级的典型值:、
因此,在8位量化下,为满足人眼可见度阈值、避免轮廓失真,亮度的最大/最小比率需控制在13~156区间。
韦伯定律将人眼对亮度的最小可辨差异与图像的量化级数结合,推导出为保证无轮廓失真,最大与最小亮度之间需满足的对数比率关系。
下面基于韦伯定律进行公式递推连续量化级在可见度阈值下的亮度比率公式。
有 个连续的量化亮度等级,要让相邻两级的差都刚好是人眼刚好能察觉的阈值,这样就不会出现可见的轮廓,从最低亮度 开始,一级一级往上推。
第1级亮度:
第2级亮度,要比第1级大一个刚好能察觉的差
第3级亮度,比第2级大一个刚好能察觉的差
第 级亮度:
把公式两边同时除以 ,得到公式: