索尼CMOS傳感器的各種對焦技術
來源:深圳市凱茉銳電子科技有限公司2025-02-24
1,反差對焦
作為最早的自動對焦技術,其技術原理是最簡單的,同時也是最自然的,因為人眼對焦所基于的原理也是反差式——通過大腦對畫面的反差信息之判斷從而調節晶狀體的對焦。
“反差”的具體判斷原理為:當物體不在焦內時,畫面虛化成一個個彌散圓疊加在一起,此時彌散圓的半徑遠大于點,因此亮度和對比度都低;而當對焦準確時,焦內是一個個的點,畫面銳利因此對比度高。
也就是說,對焦不準確之時整個畫面都是模糊的,沒有明顯的反差信息;而當對焦準確之時,焦點范圍圖像是最清晰的狀態,而焦點之外的區域則表現為模糊狀態,反差非常明顯。
判斷原理說完,那么具體的工作原理就很好理解了。當鏡頭對準被拍攝物體時,對焦模組的馬達便會驅動鏡片從底部向頂部移動,在這個過程中傳感器會進行全面檢測。
同時傳感器還會持續記錄所檢測到的對比度等反差數值,當找到反差最大的位置后,運動到頂部的鏡片便會回到這個位置從而完成最終的對焦。
在這個過程中,會看到取景框內容有一系列的模糊清晰之反復變化過程,與此對應的術語便是“拉風箱”。其優點是技術簡單且成本低,但缺點也很明顯——耗時太長了!
2,相位對焦 / 激光對焦 / TOF 對焦
有趣的是,相位對焦(Phase Detection Auto Focus,簡稱為PDAF)技術其實也與人眼有關,只不過其相關的是“人眼測距”原理——雙眼由于位置不同故接收光線會形成視差從而得知物體遠近。
根據這個人眼仿生原理,手機CIS會設置一些“掩蔽式相位對焦像素”,即有些像素上面的彩色濾光片會被屏蔽左一半或右一半,而這些左、右掩蔽式相位對焦像素便配成了一對從而得以模擬人眼檢測光信號的距離信息。
然后檢測到的信息會交給 ISP 計算相位差,最終計算結果出來之后就可以直接指引鏡片移動到合適的位置以完成合焦。由于這個過程是一步到位的,所以實際對焦速度明顯比反差式對焦更快。
那么具體的計算判斷過程如何呢?原來在合焦狀態下,投影在感光區的光線距離是有既定數值且會對應一部分配對的相位對焦像素點——此為事先設計好的焦點檢測基準。
在此基礎之下,代表被攝物體距離偏近的前焦狀態,其所投射之較小間距便會顯示波峰向中心偏移,而這個波峰的偏移量便是相位差。
根據波峰的偏移方向以及相位差信息,鏡片就會知道移動的方向以及移動的距離。同理,代表被攝物體距離偏遠的后焦狀態之工作方式照此反推即可
雖然這種對焦方式不需要來回試探,只需一次鏡片移動即可完成對焦,但為了提高對焦精度還是需要與反差對焦組合使用——先用相位對焦快速移動鏡片再以反差式對焦微調。
理論上來說,用于相位對焦的像素越多則對焦速度越快,但由于掩蔽式相位對焦像素不參與成像,所以增加過多的相位差檢測像素便會造成后期插補圖像信息困難,使得圖像畫質下降。
此外,這些相位差檢測像素的數量瓶頸又限制了暗光環境對焦性能。為了解決暗光對焦問題,首先引入的是激光對焦傳感器——其能發射紅外光線進行物理測距從而輔助對焦。
但是,這種采用意法半導體方案的激光對焦有距離限制(一般2米以內),于是后面索尼就出場了。
索尼方案具體可分兩種,一種是原理與激光對焦一樣的 dTOF 方案。
索尼的 dTOF 功率更大適合遠距離對焦,故很快便替代了意法半導體方案,成為各大旗艦首選。
另一種則是成本更高的 iTOF 鏡頭方案,其通過投射面光源,再積存反射光并檢測與光源的相位差,從而間接測定深度信息。
iTOF 方案雖然只適合中近距離對焦,但其卻有精度更高的優點。
那些用在前置 3D TOF 人臉識別模組上的便是這種方案,另外一些老款頂級旗艦還會將其用在后置影像模組中參與混合對焦。
3,全像素雙核對焦 / “2×1 OCL”雙核對焦
雖然 TOF 方案可以輔助暗光對焦,但掩蔽式相位對焦在畫質損失方面的缺點卻無法解決;為此基于雙PD共享 OCL(片上微透鏡)像素結構的全像素雙核對焦技術,便登上了歷史舞臺。
其具體原理,就是讓這兩個 PD(光電二極管)組成全新形式的一對“眼睛”,再通過雙PD的“一開一合”獲得相位差檢測能力。且由于兩個PD的信息可以相加,因此得以消除相位差影響并最終獲得無損畫質。
這樣結果就很明顯了,以往的掩蔽式相位對焦僅有少量的像素參與對焦,而這個雙核對焦直接就是全像素皆可對焦!關鍵其還能獲得全部的進光量,使得暗光對焦性能也不會被削減!
也就是說全像素雙核對焦一問世,便直接解決了以往掩蔽式相位對焦所存在的對焦像素量少、畫質易受損、暗光對焦性能弱等三大頑疾!一躍成為了當年旗艦傳感器的首選對焦技術。
但全像素雙核對焦啥都好,就是有個很明顯的缺點——由于要放置兩個PD因此其像素尺寸不能太小,于是“2×1 OCL”雙核對焦就冒出來了。
也就是說有兩個像素共用了一個大的微透鏡,并以此組成一對“眼睛”進行相位對焦。這樣不管像素尺寸有多小,只要有個大的微透鏡能罩住它倆,就能組成一種全新形式的“雙核對焦”。
“2×1 OCL”雙核對焦由于沒有掩蔽損耗,故其進光量相較于掩蔽式相位對焦直接就翻倍了!
不過這些“2×1 OCL”像素并不參與成像,所以其只能和掩蔽式像素一樣部分存在于CIS上。雖然其各方面性能都比不上全像素雙核對焦,但這并不妨礙手機廠商故意將其簡稱為“雙核對焦”以蹭全像素雙核對焦的光。
那么在手機宣傳中該怎么分辨這兩種技術呢?其實很簡單,就看有沒有“全像素”這個前綴即可。
知識插補:Quad Bayer 排列
為了講清楚以下的對焦技術,這個知識點還是得補充一下的。如上圖所示,Quad Bayer 排列的每個顏色之濾片皆覆蓋了四個像素,感覺好像是 Bayer 排列的“放大版”。
實際確實如此,那為何要多此一舉呢?剛開始的時候,是因為像素尺寸太小濾色片工藝跟不上,只能采用這種“曲線救國”的方式,順帶還能在營銷環節大肆吹噓一波。
后面隨著“卷大底”潮流盛行,大像素開始受到重視,這種情況就不復存在了,但其依然沒被淘汰——可見是有“真本事”的。下面就詳細講一下,其轉為高像素模式的工作原理。
首先,Quad Bayer 排列要進行PD補償和壞點補償。然后由于所覆蓋的子像素位置不同,導致感光能力有一定差別,所以就需要引入 Crosstalk。
具體來說就是將全圖分成多個 ROI 方塊,然后計算各像素通道的能量并確定其補償數據,最終使用這些校準數據從而讓原本不均勻狀態的能量分布變得更為平衡。
落到實處的效果就是,Crosstalk 校準補償可以去除由于信號差別造成的格子、鋸齒狀等色塊干擾——這種干擾現象在拍攝單一色塊時尤為明顯。
經過這些補償操作后,就正式開始進入 Remosaic 環節了,這個過程也分為三步。
第一步:利用插值算法,將 Quad Bayer Raw 數據轉換為三組RGB數據。
第二步:再用將 RGB Image 轉Bayer的算法,將其分解為三組 Bayer Raw Image。
第三步:將三組數據合為正常的 Bayer 排列,并送到ISP進行“去馬賽克”處理。
熟悉“去馬賽克”算法的朋友,看到這個 Remosaic 環節估計會很熟悉,畢竟有些步驟是一樣的。當然,這只是最基礎的一套 Remosaic 算法。
后面隨著 Quad Bayer 技術的發展,索尼還研究出了其它更先進的轉換排列算法。于是,低光照情況下像素合成以擴展進光量,高光照情況下轉 Bayer 排列以獲得高解析力,就成為了這個技術的宣傳點。
但是,凡事有利必有弊,這個技術先天就有個明顯缺點——即采樣空間精度下降這個難題,畢竟 Bayer 陣列本來就是靠猜色插值來輸出圖像的!
4,全像素全向對焦
隨著 Quad Bayer 技術的發展,索尼還拓展出了一種全新的對焦技術——直接用 Quad Bayer 排列的四個像素去對焦。
前面說到,“2×1 OCL”雙核對焦雖然可以應對像素尺寸很小的傳感器,但在綜合性能方面卻明顯弱于全像素雙核對焦,那么有沒有兩全其美的方案呢?
這時候如果每一片微透鏡都能覆蓋四個像素,那么在 Quad Bayer 排列的加持下,那不就相當于“全像素四核對焦”了嗎?
而且全像素雙核對焦還有個缺點,那就是在面對缺少圖案變化的拍攝物體時不太敏感,也就是說其橫向紋理對焦能力偏弱。
這就好像傳統單反上的“一字對焦點”,只能檢測豎向紋理,那要加強對焦性能該怎么辦呢?首先就是增加橫向紋理的對焦能力,從而組成“十字”對焦點陣列。
這時候如果一個微透鏡能夠覆蓋四個像素,那不就可以分割成左右、上下、斜向來檢測相位差嗎?而這就是所謂的“米字”對焦。
同時在暗光環境下,還可以利用“像素四合一”模式和全像素對焦特點最大程度地拓展進光量,故其暗光對焦性能非常強。
不過,這個對焦技術有個很大缺點,那就是在微透鏡數量巨幅減少的情況下,切換到高像素模式時其解析力和默認的像素合成狀態沒啥明顯區別。
這就是為什么采用局部“2×2 OCL”結構的豪威OV64B(下圖左邊所示),能在長焦望遠方面發揮大作用的根本原因。
那為什么全像素“2×2 OCL”結構會讓高像素模式接近形同虛設呢?簡單來說可以回想全像素雙核對焦,有沒有因為單像素多個PD提高了解析力?
具體來說,則是又回到了 Quad Bayer 排列所面臨的采樣空間精度下降問題:本來濾色片這么玩就影響到解析力了,結果微透鏡還跟著這么玩!
總的來說還是歸因于算法不能憑空增加細節這個本質,雖然如今在 AI 加持下高像素算法已經很牛了,那么在像素結構層面能不能有更好的方案呢?
5,全像素八核對焦
沒錯,最終的答案就是結合了 Quad Bayer 排列和單像素雙PD結構的全像素八核對焦,如今索尼的頂級旗艦傳感器皆采用了這個技術。
按照索尼官方的說法,這個對焦技術最大的特點就是在進行HDR拍攝時,長曝光、中曝光和短曝光的所有像素皆能獲取相位差。
這就是 QBC3-HDR 技術所展現的奇效,在對焦時可以不受目標物亮度的影響,這在面對大光比場景時其對焦性能便能得到酣暢淋漓的發揮。
同時全像素八核對焦,還向下兼容全像素雙核對焦的所有優點!此外在高像素模式解析力表現方面,相較于全像素全向對焦也有明顯的先天優勢。
但是,在全向對焦性能方面其依然不如全像素“2×2 OCL”結構,雖然其綜合表現已經非常極致了。
于是為了最牛的視頻錄制對焦性能,蘋果便向索尼定制了手機界獨一無二的,全像素八核對焦結合掩蔽式相位對焦之超級復合對焦技術。
但果子此舉就沒有副作用嗎?答案顯然是否定的。因為其掩蔽式相位對焦像素的密度很高,這對于拍照的解析力表現而言非常不利。
當然,大家都知道果子真正關心的還是視頻錄制性能,所以這個對焦方案對于拍照解析力的影響對其而言并無大礙,本來這世上就沒有真正完美的技術方案。
和果子一樣在視頻錄制對焦性能方面出奇招的,還有那款曇花一現的華為定制傳感器IMX608,其負責對焦的像素結構如下圖所示非常特別。
具體來說就是在像素十六合一模式下,斜向相連的那八個掩蔽式像素每兩對合成一組相位對焦結構,這像不像普通的掩蔽式相位對焦像素對?
要知道IMX608的原生像素尺寸為1.12微米,那么十六合一后就是巨大的4.48微米了!這種級別的掩蔽式相位對焦,無論是暗光對焦性能還是錄像對焦性能皆會有出色表現。
其實三星傳感器也有全像素八核對焦,只不過其又發展出了另一種特色技術方案——即綠色子像素通過斜切的光電二極管獲得全向對焦能力。
總結:
①,反差對焦(CDAF)——功能機時代就存在的古老技術,可以精準找到對比度最高的對焦點并自動對焦,技術簡單成本低但是耗時過長。
②,掩蔽式相位對焦(PDAF)——由iPhone6系列首發,能夠根據相位差信息計算出對焦點從而快速對焦,缺點是對焦性能受限于對焦像素數量、暗光對焦性能弱和掩蔽式結構有損畫質。
③,全像素雙核對焦(Dual PD)——由三星S7系列首發,通過全像素雙PD結構一舉解決了 PDAF 的全部缺點,但橫向紋理檢測能力弱。
④,“2×1 OCL”雙核對焦(Dual PDAF)——由OPPO R9s系列首發,通過部分不參與成像之共享微透鏡的雙像素獲得相位對焦能力,暗光對焦性能雖然比 PDAF 強但其它缺點兩者皆一樣。
⑤,全像素全向對焦(2×2 OCL)——由OPPO Find X2 Pro首發,通過 Quad Bayer 排列四像素共享大微透鏡的結構,獲得極致暗光對焦性能和全向對焦能力,缺點是高像素模式接近形同虛設。
⑥,全像素八核對焦(Octa PD)——由華為P40系列首發,通過 Quad Bayer 排列和 Dual PD 的結合,在高像素模式解析力無憂情況下還額外擁有超牛HDR對焦能力,但橫向紋理檢測能力弱。
相關資訊
- 2025-03-10
- 2025-03-07
- 2025-03-06
- 2025-03-05
- 2025-03-04
- 2025-03-03