1.3 视点合成技术国内外研究现状
1.4 视点合成的原理
多视点视频系统合成算法的设计和实现主要工作是在多视点视频系统之中合成算法的设计和实现。多视点视频系统中合成算法主要处理两部分内容:前景物体和背景。
在合成的过程中采取不同的手段处理前景和背景。对于前景的合成算法主要分为三个步骤:图像特征的提取和跟踪,建立对应视频对象的不完全三维结构,生成中间图像的插值运算。对于背景的处理采用sprite的方法生成一幅摄像机系统覆盖场景的全景图。通过前后场景的融合形成虚拟视点图像。
多视点虚拟视频图像合成方法的改进目的主要包括两个方面:合成图像的质量和合成算法的整体处理速度。文献综述合成虚拟图像的质量是最终评判算法的重要因素。
进行改进时主要考虑从图像特征跟踪的质量和数量以及图像中视频对象的边缘处理进行改进。关于算法的处理速度主要从系统级的模块设计,算法级的优化两个方面给出设计方案。
1.5 论文的工作内容与结构安排
第一章介绍了研究视点合成技术的意义,视点合成技术背景,视点合成技术国内外研究现状以及视点合成的原理。
第二章从生理学角度介绍人类获得立体感的原理。
第三章介绍了立体图像的显示技术,其中也介绍了图像的表示,颜色表的定义和作用,RGB色彩空间的定义,灰度图像、彩色图像的概念和其存储方式,最后介绍了YUV视频的文件结构。
第四章 前面已经介绍了立体图像的显示技术,本章则着重讲解立体图像的获取的方法,怎样由真实的图像获得虚拟视点,并最终由真实视点和虚拟视点共同获得立体图像。
2 立体视觉原理及特性研究
2.1 物体的外貌和位置
人的眼睛有着接收及分析视像的不同能力,从而组成知觉,以辨认物象的外貌和所处的距离,及该物在外形和空间上的改变。脑部将眼睛接收到的物象信息,分析出四类主要资料;就是有关物象的空间、色彩、形状及动态。有了这些数据,我们可辨认外物和对外物作出及时和适当的反应。此外,人眼能看到色彩,称为色彩视或色觉。此四种视觉的能力,是混为一体使用的,作为我们探察与辨别外界数据,建立视觉感知的源头。眼睛除了要辨认物象的特征,还要知道对象的位置,及其活动上的变化,才可驱使身体其它部位作出相应的动作。
在理解自身与外界之间的距离或深度,人类的知觉,可从视野所得的资料中,抽出有关空间的提示,从而知识到自己与各种对象的距离。视网膜是视觉的核心,它是一片平面的薄膜,获得的物象是平板而缺乏立体感的。所以知觉需要组织起其它信息,才能做出对深度的感知。人类的眼球天赋便有辨别立体深度和距离的本能,因为人类是用双目平排而视。同时通过外物在视野范围中所形成的物象大小,以及排列或表现的状态,认知该物与我们的距离。源:自~751·论`文'网·www.751com.cn/ 甚至可通过形状及色彩获得有关距离的资料。·眼睛能看到物体的移动,有助辨别物体的方向和运动的速度。
2.2 眼球的结构
视觉是指视觉器官眼睛(或眼球),通过接收及聚合光线,得到对物体的影象,然后接收到的信息付会传到脑部进行分析,以作为思想及行动的反应。眼睛光学结构图如图1所示。
要感知外在环境的变化,要靠眼睛及脑部的配合得出来,以获得外界的信息。人类视觉系统的感受器官是眼球。眼球的运作有如一部摄影机,过程可分为聚光和感光两个部分。