1.4 本文的研究内容以及论文组织
本文在全面研究目前的视频摘要技术的前提下,对视频关键帧摘要的两个核心技术进行了深入的研究,给出了一个3D视频关键帧摘要生成的方法,并对比了3D视频的普通视频和深度视频,具体内容如下:
(1)首先介绍3D视频的结构,包括普通视频和对应的深度视频。
(2)对现有的比较成熟的场景切分算法进行了概述,采用基于窗的自适应阈值算法对视频进行镜头聚类、场景分割。
(3)研究现有的基于像素匹配、直方图、边缘等图像描述方法,采用灰度直方图描述帧图像的基本特征。
(4)在基于镜头聚类的基础上,通过每个镜头内的局部阈值来提取符合要求的关键帧。
(5)使用VC6.0平台和OpenCV数据开发库编写对应程序,对所采用的关键帧提取算法进行了实验,对比了普通视频和深度视频,并对实验结果作出了分析。
本文的论文组织上,本文描述了3D视频关键帧摘要技术,并通过提取深度视频的关键帧来帮助正常的视频摘要。
第1章先介绍了视频摘要的研究背景、基本研究现状和一般的研究内容。
第2章介绍了视频摘要的相关概念及技术,其中包括视频数据的结构特点、基于深度的3D视频的结构特点,分析了视频镜头分割和关键帧提取两个关键步骤,给出实现这两个步骤的基本方法以及本文要采用的方法。
第3章介绍本文要采用的自适应阈值算法。首先介绍了简单的RGB颜色模型,以及构造图像的灰度直方图来表示视频帧特征的方法,进而比较图像的相似性。然后介绍了基于灰度直方图的自适应阈值算法。
第4章介绍了本文实现的自适应阈值算法完成镜头场景分割;最后基于镜头聚类实现关键帧提取。并且对普通视频以及深度3D视频的关键帧提取结果做出了分析。
第5章对算法结果进行了分析总结,并且对以后进一步的研究工作做出了展望。