祁子禹
引言
在奔逸不羁的童年,笔者对理科知识的好奇无际无边。某天曾在外婆家的煤棚子里一通乱翻,缴获了大舅学生时代的几何光学课本,不料遭遇开幕雷击:
“人的眼球好比照相机,我们要为革命而保护视力!”
对于一个孩童干瘪的脑袋来说,实在是难以领悟眼球和相机有何关联,也就更别提它们如何跟革命扯到一起了。时隔多年,笔者当物理学家的童年梦想未果,而是成为了一名脑外科医生。有了医学专业背景再回想,觉得书上这话讲得还算不孬——两只眼球属实如同两枚相机,乖巧而警觉地伏于眶窝内,可调光轴(眼外肌),可调焦距(睫状体)、可调光圈(瞳孔),既有底片(视网膜),又有电缆(视神经),最后把照片发给主机(大脑)。大脑整合双眼图像,分析差异,计算出物体到眼球的距离与深度。这些信息加上日积月累的视觉经验,便造就了双目立体视觉,使人看到立体的世界。
归纳逻辑推理告诉我们:欲谋取对事物的完整理解,要把问题一般化,还要把问题特殊化。上一段文字从眼球与相机的关系中抽象出了双目立体视觉的概念,是问题一般化。而问题特殊化是反向过程,即从双目立体视觉的概念反观眼球与相机的比喻,便可总结事物的关键部分和次要部分,专注于分析与科学问题关联最大的因素。
场景的简化版显而易见——空间中有一物体,双眼正注视着这个物体,产生两幅图像。大脑分析处理两幅图像,造就了双目立体视觉。前人正是通过双眼看世间万物这个模型,抽象出了对极几何的数学概念。本文从眼球-相机的比喻出发,聊聊笔者对对极几何中的四个重要矩阵,即外参矩阵、内参矩阵、基本矩阵和本质矩阵的直观理解。