第八章 Display Referred 和 Scene Referred
- Color
- 十分钟系列
第八章 Display Referred 和 Scene Referred
今天我们来聊一聊 Display Referred
和 Scene Referred
。
只要对色彩科学有兴趣或者研究的人一定都听过这两个名词(当然,可能被翻译成为了中文,叫做“显示相关”和“场景相关”)不是特别理解的人可能会有这样的结论:
Display Referred
是和显示器相关的……至于怎么个相关法?总之就是相关啦!Scene Referred
比Display Referred
要牛逼一些……
没错,上面两个粗略的理解都是正确的。但是如果能够更清楚的明白二者之间的不同,我们就可以更好的理解色彩空间。并且,没准你会从另外一个角度对 linear、gamma 有更深的体会。甚至自己就能够解释:“为什么VFX 要用Linear 类型的色彩空间来制作,而DI、绘画需要使用带有Gamma 的色彩空间呢?”
8.1 从真实世界开始
世界一切的起源都是现实本身。所以为什么能够分出Display Referred
和Scene Referred
,也要从一点点物理开始。【莫慌!】先假设你已经知道了一些基本的知识:
- 光是一种能量
- 人眼对于亮度的感知并不是线性的
好了,有了上面的两点,我们来想象一下下面的场景:假设我们有一个“完美”的灰卡。那么假设外界的光照强度是1.0,那么灰卡应该反射多少光线的能量呢?【这里都简化为完美的情况来讨论】
只要有点经验的人就会说0.18。因为灰板的反射率是18%,所以入射能量为1.0 的时候,反射的能量就是 1.0 x 18% = 0.18。
这是从物理的角度来考虑问题,但是如果从人眼的角度来考虑,又是怎样的呢?
大家又知道,18% 的灰板大家习惯称为“中灰”。
“中灰”的“中”有两个含义:
- 第一个含义是表示“中性”,也就是不存在色偏;
- 第二个含义是“中间”,也就是看起来的亮度是一半。
这就出现了分歧:对于物理来说,明明只反射了18% 的能量,但是人眼看起来却觉得是50%?
很多人都会立刻回答:“这是由于进化过程中,眼睛采用了对数感知。所以对于暗部的光线会敏感,而对高亮会相对不敏感”。
没错,最终的结论是这样的,但是更深的考虑下去,就会发现,这一个重要的分水岭!
8.2 Scene Referred (场景相关)
其实Scene Referred
的理解是很简单的,因为他就是描述了现实世界
“Scene Referred 表示图像中的数值可以(近似)的认为就是真实场景中光照的强度”
由于Scene Referred
图像可以认为还原了真实场景中光照的强度,那么就会拥有如下的特性:
Scene Referred
图像基本都是Linear 的。(光的强度就是线性的)Scene Referred
图像基本都是HDR 的。(没人规定光照强度的上限,所以动态范围是非常大的)
由于是描述真实的物理,所以基本上所有的“艺术”创作都不能生成这样的图像。
比方说绘画,你看到的颜色,都是经过人眼非线性处理之后的感觉,并不是真实的光的强度。
还是拿上面“中灰”的例子来说,比方说你调出了“中灰”的颜色,对于你的感知是50%,而真实的强度是18%。
反之,只有测量仪器、CG渲染引擎…… 这类设备才能够生成Scene Referred
图像。
因为测量仪器就是在检测光线能量本身,CG 渲染引擎更是尽可能的在模拟整个世界本身。
8.3 Display Referred (显示相关)
Display Referred
就相对麻烦很多。由于是科普文章就简化为:
“Display Referred 是指图像数值已经经过某种变化,变化后的数值可以直接呈现在相应色域的显示设备上,并且符合人眼的感受”
可以看出Display Referred
和Scene Referred
有点对立,因此Display Referred
的特点如下:
Display Referred
图像基本都是有Gamma 的Display Referred
图像的动态范围会受制于显示设备
我们基本可以认为所有从网上找到的照片都是属于Display Referred
的。
更宽泛的来说,如果一张图片在各种显示器直接看起来就是“正常”的,我们可以认为这样图片就是Display Referred
。
8.4 转换
既然存在了两个不同的东西,人们往往都是希望他们之间可以相互的转换。就好像如果有两种语言,就会出现翻译一样,Display
和Scene
之间也是可以转换的(后面都省略referred,因为打字太累了)。
我们还是回想一下最开始灰卡的例子。
真实能量18% 对应人眼感受的50%,这不就是一种转换的关系么?
如果我有时间,就可以找到物理中0.01%~99.99% 的能量是如何对应人眼的感受,这样的话,我们就能够得到一条曲线,这条曲线就是从物理到人眼的对应关系。也就是Scene
到Display
的对应关系了!
测量的越是精密,得到的曲线肯定是有点弯弯曲曲的,但是为了计算的简便(没错,又是为了简便),就用一个简单的公式进行拟合。
上面的曲线是方程:
可以看到当输入为0.18 的时候,得到的结果是0.489,接近0.5。这也就是当年为什么Rec 709
使用gamma 2.4
的原因之一。
但是既然说到转换,就要考虑转换的过程是不是会造成损失?
一般来说,从Scene 到Display 都是没有问题的,因为Scene 是真实的物理,范围大、信息足,可以认为是从“大”范围缩小到“小”范围,我们可以通过插值、映射等等方式留下我们需要的信息,减少或者放弃我们不需要的信息。
但是反过来就有问题了,Display 到Scene 的时候,由于Display 可能已经舍弃了某些信息,当从“小”范围转换到“大”范围的时候,我们就无法得知不存在的部分。
(可以想象一下,我可以把真实的风景拍成sRGB 照片,风景中的太阳的亮度是10000,湖水的反光是100,但是拍成照片之后,二者记录的数值都是1。当我想要从这张照片恢复真实场景的强度时,我就无法得到真实的太阳亮度和湖水亮度……)
OETF 和 EOTF
估计有些人看到过这两个英文缩写,如果没看过的,那么我推荐跳过这一部分,因为越看越迷糊……
OETF
是指 Opto-Electronic Transfer Function
,直译过来就是光电转换方程。
EOTF
就是 Electro-Optical Transfer Function
,直译过来就是电光转换方程。
这两个一正一反,正好描述了光线强度到信号之间的转换。
如果我们来看Rec 709
色彩空间,他的OETF
就是gamma 2.4
。所以说gamma 的变化可以认为是OETF
的一个特殊情况。
说到OETF
可能有需要带上一点Capture Referred(摄影机相关)。
老年间,数字摄影机的能力还不是那么强,无法动不动就捕捉13+ stop 的动态范围,信号处理的速度也不那么快,存储容量带宽也不是那么宽裕。
因此为了更好的记录暗部的细节,所以摄影机会把真实的场景光线强度通过某种变化,让暗部的信息有更多的编码来存储。
最常见的就是Rec 709
的gamma 2.4
。
编码之后的电信号就会通过各种传输方式到达显示终端。显示终端会用自己的EOTF
反变换,把电信号解码还原出自身显示的光线强度。最后人看到了“正常的图像”。
但是随着人类对于色彩科学研究的加深以及计算机处理能力的提高,我们可以使用更为复杂的OETF
来进行有效的编码,更为有效的利用编码范围。同时随着显示设备的多样化,EOTF
的反变化也是越来越复杂。
如果拿Alexa
的摄影机来说,LogC
曲线其实就是Arri
的OETF
,使用了这种类似Log 的编码方式,可以更有效的记录人眼敏感的范围。
还有 Dolby
的PQ
(或者应该说是SMPTE 2084
)曲线,也是OETF
,目的都是一样的。
一句话(不完全正确)的概括:
OETF 有点像给线性的能量加上一些类似Gamma 的变换,得到了变化后的编码数值,方便后续的记录、传输。
而EOTF 正好相反,将编码后的数值反编码,得到尽可能接近真实场景光照的结果。
EOTF
会受到显示设备自身能力的制约。
比方说就算我数学上还原了真实的光照强度,但是SDR 显示器的最高亮度只有100nit,那么我不可能重现太阳那种亮度。
相反的,为了照顾这些超过的亮度,EOTF
可能还要做出一些补偿计算,让稍稍超过的部分可以进入到显示器的能力范围之内。
如何得到一个OETF
和EOTF
这明显超过了科普的范围,因此就到此为止了。
8.5 ACES 在这方面的优势
如果理解了上面Display
和Scene
的区别,应该就可以理解ACES
对于统一色彩流程的优势了。我们在制作过程中常见的素材种类有:
- 数字摄影机拍摄的素材
- CG 渲染引擎生成的图像
- 传统的图片(网络下载、PS 绘画……)
如果我们有一种方式能够把这些素材都还原成为真实场景光照,那么匹配、合成、渲染就会无缝链接到一起了。
幸运的是,如果采用ACES
的色彩管理方式,绝大多数的数字摄影机RAW 厂家都提供了ACES
的IDT
(phantom、BMD 你们加油啊……)
CG 渲染引擎本来就是模拟真实世界的物理情况,所以也可以得到真实的Scene 图像。
传统图片是个难点,但是从目前来看,在可以记录的范围中,还原的情况还是可以的。(当然会有一些蜜汁问题,这里就不深入讨论了)
可以把以前的工作方式认为是操作编码后的数值,而现在就好像我们真的在同一个真实世界中进行光线的操作,当光线的能量相同的时候,这些素材就肯定是匹配的。这种操作本质上更加的科学。
8.6 结束语
Scene
和Display
两种工作方式各有优势:
Display
显得更加直观Scene
是更加的科学
VFX 常说的“Linear 工作流”本质就是Scene
的工作方式。
没有最好的工作方式,最重要的是理解Scene
和Display
,然后根据项目的需要,做出最符合需求的选择。
没准是完全的ACES
、没准是完全的Display
,更可能的是二者的结合。在不同的环节选择不同的色彩工作方式,才是坠吼的!
后排睡着同学醒醒,下课啦!