對極幾何

對極幾何（英文：Epipolar geometry）係處理立體視覺嘅幾何，意指兩台相機從兩笪埞唔同嘅嚟睇一幅 3D 場景嗰陣（可以3D物體，或者佢上高嘅一粒點或者一條線），啲3D 點戥佢哋啲 2D 投影存在有好多啲幾何拏褦，啲喺圖像點之間造成咗一啲約束條件。一般嚟講，啲拏褦可以基於近似假設相機成針孔相機模型推導出嚟；但一啲特殊嘅相機（譬如推掃式嘅）會需要到遞啲模型。對極幾何係八點算法或者多視角幾何嘅基礎概念，雖然啲後者對原本嘅過程有返唔同程度嘅擴展。

定義[編輯]

下圖描繪咗兩台睇住 $\mathrm {X}$ 點嘅針孔相機。喺真實嘅相機中，圖像面實際上係擺喺焦點後（試惗相機CCD），並產生啲圖像係關於鏡頭焦點中心對稱嘅。之不過，爲咗方便，對極幾何入便擺啲圖像面去焦點中心（即Cardinal point）前面（圖中兩幅灰藍色面），嚟保持啲圖像上下左右嘸因對稱性而翻轉。其中， $\mathrm {O} _{L}$ 同 $\mathrm {O} _{R}$ 代表緊兩台相機鏡頭嘅對稱中心。 $\mathrm {X}$ 作爲兩台相機關注緊嘅點，個點 $\mathrm {x} _{L}$ 同個 $\mathrm {x} _{R}$ 即係點 $\mathrm {X}$ 喺啲圖像面上嘅投影。

每台相機都影到 3D 世界嘅 2D 圖像。噉樣嘅從 3D 到 2D 嘅轉換喊做透視投影，係攞針孔相機模型嚟描述。建模好多時係透過啲射線係從某相機發出而且穿過佢個焦點中心嘅嚟做投影。每條發出嘅光線對應圖像嗰度嘅一粒點。

對極約束[編輯]

令 $\mathbf {R} ,\mathbf {T}$ 係兩便參考系之間嘅旋轉同平移，點 $\mathrm {X}$ 喺兩個參考系入便啲坐標（ $\mathbf {X} _{L}$ 同 $\mathbf {X} _{R}$ ）可以透過 $\mathbf {X} _{R}=\mathbf {R} \mathbf {X} _{L}+\mathbf {T}$ 表示到。乘埋反對稱矩陣（skew-symmetric matrix） ${\hat {\mathbf {T} }}$ ，因爲佢戥 $\mathbf {T}$ 正交，所以 ${\hat {\mathbf {T} }}\mathbf {T} =0$ ：

{\hat {\mathbf {T} }}\mathbf {X} _{R}={\hat {\mathbf {T} }}\mathbf {R} \mathbf {X} _{L}+{\hat {\mathbf {T} }}\mathbf {T} ={\hat {\mathbf {T} }}\mathbf {R} \mathbf {X} _{L}

再乘埋 $\mathbf {X} _{R}^{\mathrm {T} }$ ，因爲佢戥 ${\hat {\mathbf {T} }}\mathbf {X} _{R}$ 正交，得到

\mathbf {X} _{R}^{\mathrm {T} }{\hat {\mathbf {T} }}\mathbf {X} _{R}=\mathbf {X} _{R}^{\mathrm {T} }{\hat {\mathbf {T} }}\mathbf {R} \mathbf {X} _{L}=0

即有對極約束（epipolar constraint）式：

\mathbf {X} _{R}^{\mathrm {T} }{\hat {\mathbf {T} }}\mathbf {R} \mathbf {X} _{L}=0

令 $\mathbf {E} ={\hat {\mathbf {T} }}\mathbf {R}$ ，即當乘積 ${\hat {\mathbf {T} }}\mathbf {R}$ 係本質矩陣（essential matrix），所以改寫成：

\mathbf {X} _{R}^{\mathrm {T} }\mathbf {E} \mathbf {X} _{L}=0

對於啲圖像面座標 $\mathbf {x}$ ，同埋某個對應嘅深度距離 $\lambda$ ，有：

\lambda _{L}\mathbf {x} _{L}=\mathbf {X} _{L}

\lambda _{R}\mathbf {x} _{R}=\mathbf {X} _{R}

所以從一幅圖面轉到另一幅圖面嘅對極約束式都幾乎相同：

\mathbf {x} _{R}^{\mathrm {T} }\mathbf {E} \mathbf {x} _{L}=0

未校準相機[編輯]

相機座標系啲點座標未必可以代表佢喺圖像上對應像素點；所以引入校準矩陣 $\mathbf {K}$ （calibration matrix），係噉啲圖像面座標 $\mathbf {x}$ 同埋參考系座標 $\mathbf {X}$ 到像素座標 $\mathbf {x} '$ 嘅轉換可以寫得成：

\mathbf {x} '=\mathbf {K} \mathbf {x}

\lambda \mathbf {x} '=\mathbf {K} \mathbf {X}

係噉原對極約束式可以轉成式：

\mathbf {x} _{R}'^{\mathrm {T} }\mathbf {K} ^{-\mathrm {T} }\mathbf {E} \mathbf {K} ^{-1}\mathbf {x} '_{L}=0

令 $\mathbf {F} =\mathbf {K} ^{-\mathrm {T} }\mathbf {E} \mathbf {K} ^{-1}$ ，即當乘積 $\mathbf {K} ^{-\mathrm {T} }\mathbf {E} \mathbf {K} ^{-1}$ 係基礎矩陣（fundamental matrix），可以改寫成未校準相機嘅對極約束式：

\mathbf {x} _{R}'^{\mathrm {T} }\mathbf {F} \mathbf {x} '_{L}=0

另外，從對極平面直接映射可以有以下證明^[1]：

令 $\mathbf {x} _{L},\mathbf {x} _{R}$ 點 $\mathrm {X}$ 喺兩便圖像噶投影點座標，因爲 $\mathrm {X}$ 喺經 $\mathbf {x} _{L}$ 嘅射線上，所以有對極線 $\mathbf {l} _{R}$ 、上高有點 $\mathbf {x} _{R}$ 嘅；因爲 $\mathbf {x} _{L},\mathbf {x} _{R}$ 都係 $\mathrm {X}$ 喺對極平面 $\mathrm {\pi }$ 嘅像，因爲兩者射影等價於點集 $\mathrm {O} _{L},\mathrm {X} ,\mathrm {X} _{1},\dots$ （即點集喺左圖像面啲投影 $\mathbf {x} _{Li}$ 戥右圖像面啲投影 $\mathbf {x} _{Ri}$ 等價），所以互相之間有2D單映射關係 $\mathbf {x} _{R}=\mathbf {H} \mathbf {x} _{L}$ ；因爲對極線係穿過對極點，所以 $\mathbf {l} _{R}=[\mathbf {e} ']_{\times }\mathbf {H} _{\pi }\mathbf {x} _{L}$ ；係噉可以令 $\mathbf {F} =[\mathbf {e} ']_{\times }\mathbf {H} _{\pi }$ 。而對於某一點 $\mathbf {x} _{R}$ 喺 $\mathbf {l} _{R}$ 上，有 $\mathbf {x} _{R}^{\mathrm {T} }\mathbf {l} _{R}=\mathbf {x} _{R}^{\mathrm {T} }\mathbf {F} \mathbf {x} _{L}=0$ ，即有對極約束條件。

對極約束同三角測量[編輯]

若果兩台相機嘅相對位置已知，有以下兩個重要嘅觀察結果：

假設投影點 $\mathrm {x} _{R}$ 已知，對極線 ${\overline {\mathrm {x} _{R}\mathrm {e} _{R}}}$ 已知，而且點 $\mathrm {X}$ 投影到右圖度嘅點 $\mathrm {x} _{R}$ 上，位於條特定嘅對極線 ${\overline {\mathrm {x} _{R}\mathrm {e} _{R}}}$ 度。即係話對於幅圖像入便觀察到嘅每粒點，都必然喺第幅圖像上一條已知對極線度觀察到。係噉有極線約束： $\mathrm {X}$ 喺右相機平面上嘅投影 $\mathrm {x} _{R}$ 必須包含喺對極線 ${\overline {\mathrm {x} _{R}\mathrm {e} _{R}}}$ 當中。所有啲點 $\mathrm {X}$ 譬如 $\mathrm {X} _{1}$ 、 $\mathrm {X} _{2}$ 、 $\mathrm {X} _{3}$ 喺 ${\overline {\mathrm {O} _{L}\mathrm {X} _{L}}}$ 上嘅都可以驗證返呢個約束。噉樣即係可以測試到兩粒點係咪對應返同一粒 3D 點。啲對極約束亦都可以通過兩台相機之間嘅本質矩陣 $\mathbf {E}$ 或者基礎矩陣 $\mathbf {F}$ 嚟描述到。
若果點 $\mathrm {x} _{L}$ 同 $\mathrm {x} _{R}$ 已知，係噉佢哋啲投影線亦都係已知嘅。若果兩粒圖像點對應返相同嘅 3D 點 $\mathrm {X}$ ，係噉投影線必須喺 $\mathrm {X}$ 度精確相交。即係話，可以根據兩粒圖像點嘅坐標計返 $\mathrm {X}$ ，即所謂嘅三角測量。

簡化案例[編輯]

對極幾何可以簡化，如果兩台相機啲圖像平面吻合嘅話。喺種情況下，對極線亦都吻合埋（ ${\overline {\mathrm {x} _{L}\mathrm {e} _{L}}}$ = ${\overline {\mathrm {x} _{R}\mathrm {e} _{R}}}$ ）。另外，啲對極線係平行於基線 ${\overline {O_{L}O_{R}}}$ ，而且可以喺實踐中戥所述兩個圖像嘅水平軸對齊返。噉樣即係對於一幅圖像啲每粒點，只需沿水平線查睇就搵得到佢對應第幅圖像粒點。^[2]

如果相機位置唔可以噉擺法，係噉嚟自啲相機嘅嗰啲圖像坐標可以轉換到模擬得出有返公共嘅圖像面。個過程喊做圖像校正。

推掃式相機嘅對極幾何[編輯]

戥使用二維CCD嘅傳統frame相機唔同，推掃式相機（Push broom scanner）採用一維CCD陣列來產生又長又連續嘅圖像帶，叫做「圖像地毯」。呢種傳感器嘅對極幾何形狀戥針孔投影相機嘅極線幾何形狀完全唔同。首先，推掃式傳感器嘅對極線唔係直線，而係雙曲線。其次，對極「曲線」pair唔存在。 ^[3]之喺一些特殊條件下，衛星圖像嘅對極幾何可以認為係一種線性模型。 ^[4]

睇埋[編輯]

考[編輯]

↑ Hartley, Richard; Zisserman, Andrew (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.
↑ Amato, Alberto; Lecce, Vincenzo Di; Vincenzo, Piuri (2012). Semantic Analysis and Understanding of Human Behavior in Video Streaming. Springer Science & Business Media. p. 47.
↑ Jaehong Oh. "Novel Approach to Epipolar Resampling of HRSI and Satellite Stereo Imagery-based Georeferencing of Aerial Images" 互聯網檔案館嘅歸檔，歸檔日期2012年3月31號，., 2011, accessed 2011-08-05.
↑ Nurollah Tatar and Hossein Arefi. "Stereo rectification of pushbroom satellite images by robustly estimating the fundamental matrix", 2019, pp. 1–19 accessed 2019-06-03.

讀埋[編輯]

Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.，電腦視覺嘅經典著作之一。

Quang-Tuan Luong. "Learning Epipolar Geometry". Artificial Intelligence Center. SRI International. 喺2007-03-04搵到.

Robyn Owens. "Epipolar geometry". 喺2007-03-04搵到.

Linda G. Shapiro and George C. Stockman (2001). Computer Vision. Prentice Hall. pp. 395–403. ISBN 0-13-030796-3.

Vishvjit S. Nalwa (1993). A Guided Tour of Computer Vision. Addison Wesley. pp. 216–240. ISBN 0-201-54853-4.

Roberto Cipolla and Peter Giblin (2000). Visual motion of curves and surfaces. Cambridge University Press, Cambridge. ISBN 0-521-63251-X.

[1] Hartley, Richard; Zisserman, Andrew (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 0-521-54051-8.

[2] Amato, Alberto; Lecce, Vincenzo Di; Vincenzo, Piuri (2012). Semantic Analysis and Understanding of Human Behavior in Video Streaming. Springer Science & Business Media. p. 47.

[3] Jaehong Oh. "Novel Approach to Epipolar Resampling of HRSI and Satellite Stereo Imagery-based Georeferencing of Aerial Images" 互聯網檔案館嘅歸檔，歸檔日期2012年3月31號，., 2011, accessed 2011-08-05.

[4] Nurollah Tatar and Hossein Arefi. "Stereo rectification of pushbroom satellite images by robustly estimating the fundamental matrix", 2019, pp. 1–19 accessed 2019-06-03.

[1]

[2]

[3]

[4]