-
D lGITA数L字VI视DE频O 鬟_
【本文献信息】于鹏,王永滨,柯雅明,等.一 种基于压缩域的视频镜头检测方法[J].电视技术,2014,38(13)
一
种基于压缩 域的视频镜头检测方法
于鹏,王永滨,柯雅明,刘文,伏文龙
(中国传媒大学计算机学院, 北京100024)
【摘要】针对传统的基于空域的视频镜头检测算法需要解压缩,计算量大、效率低 的缺点,提出了一种基于压缩域的视频镜头
检测方法。该方法首先根据MPEG压缩标准,从视频流中 提取I帧中8个低频DCT系数,并对其进行分区加权求二次帧差,从而
确定镜头变换所在的GoP; 在GoP中通过计算P帧和B帧的不同类型宏块比率,来精确定位镜头边界。实验结果表明,该方法可
大大减少计算时间和数据量,且具有良好的检测效果。
【关键词】视频镜头检测;压缩域;MPEG; 二次帧差;宏块比率
【中图分类号】TP391 【文献标志码】A
Video Shot Detection Method Based on Compressed Domain
Y U Peng,WANG Yongbin,KE Yarning,LIU Wen,FU Wenlong
(School ofComputer,Communication University of China,Beijing 100024,China)
【Abstract】Aimed at the shortcoming in conventional airspace shot det ection need to decompress,computationally intensiv e and low efficiency,a video
shot detection me thod based on compressed domain is proposed.In thi s method,the 8 low—frequency DCT coefficients of I frames were extracted first
from the video st ream according to MPEG stand ̄d,and the frames ape partitioned,weighted and computed the twice-frame- difference,SO the GoP of hte
shot boundary is determined;In the CoP,by calculating the different types of macro—block ratios of the P and B frames ,to accurately detect shot bound-
ary.Experime nt result showed that,the amount of computation an d data is reduced greatly and has a good detection results.
【Key words】video shot detection;comp ressed domain;MPEG;twice—frmae—difference;macro—bl ock ratios
近年来,随着多媒体技术的蓬勃发展和“三网融合” 表性的有Arman 提 出的用I帧的若干DCT系数来进行
的大力推进,视频呈现爆炸式的增长,其所携带的信息量
镜头的检测方法,但是该方法计算的帧差比较粗略,对预
远远超过文本和语音,具有确切、直观、具 体、生动和高效 测编码的处理不够,检测精度不高。李向伟 提出了基
等特点,备受人们的青睐。镜 头是组成视频序列的物理单
于I帧DC系数的方法,该方法虽然是在压缩域上,但是
位,而 镜头检测是视频高层相关处理,如语义分析、索引、
没有考虑P和B帧,因而镜头检测不够精确。 < br>查询和内容分类的基础 ,其检测效率和准确性直接影
综上所述,针对压缩域的研究才刚刚起步 ,目前还没
响高层处理的性能和效果。
有一种很好的方法。本文在深入分析研究MPEG视 频压
许多学者对视频镜头检测进行了有益的研究,提出
缩编码及相关理论的基础上,将基于 空域检测的成功方法
了若干有代表性的方法,从多个方面、多个角度捕获了镜 与压缩域相结合,对I 帧和P、B帧进行分别处理,提出了
头边缘的特征信息 。从大的方面来说,镜头的检测方
一
种基于压缩域的视频镜头检测方法。实验表明,该方法
法可分为:基于空域的检测方法和基 于压缩域的检测方
具有良好的检测效果,且与传统的方法相比,具有较低的
法。早期,人们 对镜头检测方法的研究大都是基于空域展
计算复杂度和数据量,能够满足实际应用的要求。
开的,其主要依据镜头转换处视频底层颜色、纹理、轮廓形
状等特征的变化来实现镜头检测的,常见的 有像素比较、
1 预备知识
直方图、聚类、运动场和边缘的方法 。虽然基于空域
1.1镜头介绍
的检测算法取得了一定的成果,但是这种镜头检测方法要
镜头。。 是指 由摄像机从按下快门到停止的时间段
求必须在完全解压的前提下进行,一方面解压视频计算量
内,拍摄的一组连续相关的的图像帧,它用来表现场景中
巨大,效率低下;另一方面,解压后数据量 增大,很多算法
连续的一个运动过程 J。镜头通过视频剪辑工具进行连
在数据量急剧增大 的情况下,效果明显变差,这是该类算
接,由于剪辑手法的多样性,镜头变换也呈现丰富多彩的 法致命的弱点 。基于压缩域的方法研究较少,比较有代
样式。根据转换处过渡特性的差异,镜头 转换 可分为
基金项目:国家“863”计划项目(2011AA01A107);国家科技支撑计划 项目(2012BAH51F02)
投稿网址http://www.VideoE.cnI《电视技 术》第38卷第13期(总第441期) 7
HI D TA数L
妒
■糊数灞 < br>ld e o《n Ai…ri^n
突变和渐变两类。突变是指连续两个镜头之间没有过渡,
运动比率来进一步确定镜头边界。
两镜头之间没有任何编辑效果和时间上的延迟 ;渐变 < br>2.1镜头GoP检测
则与突变截然相反,它是指两个连续镜头在转换处相互重
2. 1.1 视频帧分区加权
叠,渐渐由前一镜头转变为后续镜头的方式,通常这个过 在基于空域的镜头 检测算法中,通常采用分区 。。
程会持续十几帧到几十帧不等,这样就使得镜头之间的过
的概念,将视频平均分成N×N区(N表示长和宽的单位
渡更加平缓,人们看起来感觉不到明显的视觉 不连续。常
数),分别计算每个分区的直方图和帧差,以此弥补直方
见的镜头渐变种类包括 淡人淡出、融化、扫描等¨ 。图1
图算法不能反映像素位置信息,但是没有考虑视频中不同
给出了视频突变渐变的示意图。
突变 渐变
区域的重要性因素。为了捕获图像的空间分布 信息,同时
考虑到视频在拍摄过程中和人眼视觉对图像不同部分的
关注程度 ,将视频非均 匀的分割为3×3子区,其中长
和宽的比例3:5:3,分区的比例如图2所示,图中每个分区 中分别标注了长和宽的单位数。
3×3 5×3 3×3
图1 视频突变渐变示意图
1.2 MPEG压缩介绍
MPEG压缩是当今国际上通用的视频压缩标准,其主
要通过两项基本技术实现压缩:基于离散余弦变换(Dis—
crete Cosine Trans form,DCT)的压缩技术和基于16 X 16宏
3×5 5×5 3×5
块的运动 补偿技术。其中,DCT变换是一种正交变换,可
将信号从空间域变换到频率域,充分减少图像内容间 的自
相关陛,使大部分的能量集中在频率域中少数几个能量较
高的低频系数上 ,只利用这 些低频系数就可以很好地
3 X 3 5×3 3×3
图2分区比例示意图
通常 ,相对于图像中心区域,4个角落和边缘的内容
恢复原始图像,其余系数在经过量化后,大部分都变成 了
显得不是那么重要,同时图像的底端字幕部分经常会干扰
在完成分区后,又定义了一个
零,从而可减少空间冗余度,实现压缩功能。MPEG在帧
镜头检测的准确性。因此,
编码时是按照图像组(Group of Pictures,GoP)进行的,每
权重矩阵w < br>一
个GoP包含了3种类型的帧,分别是I帧、P帧和B帧。
其中,I帧是基础帧,采 用基于DCT变换帧内编码的形式。
P帧需要参考前面最近的I帧或P帧进行前向运动补偿
w=1 l w W5 W lj L=I 2 4 2 I
1 1
f- ] 『 2 ]
J
1
(1)
来获得。B帧根据前面和后面的参考帧进行双向预测。 < br>式中:W 表示第i(i∈[1,9])个分区的权重值,加权系数
帧间预测编码时,编码器在 参考帧中搜索与当前帧中的每
和分区一一对应,通过分区区间大小和分区加权系数的不
个宏 块最匹配的宏块,从而计算出运动向量(Motion Vec—
均匀分配体现不同区域的重要程度, 提高镜头检测的精
tors,MV),进一步计算当前宏块的运动补偿预测差异
确度。 < br>(Motion Compensation Predictive Error,MCPE),将获得 的
2.1.2二次帧差计算
MCPE与给定的阈值进行比较,若小于阈值,则将MCPE
在对CoP进行镜头检测时,选取每个GoP的首帧作
和MV一起进行编码;若大于阈值,则 对该宏块进行内部
为特征来实现粗略的镜头检测。由MPEG编码相关介绍
编码,这种情况 说明当前帧和参考帧间的差异较大,而这
可知,I帧的DCT系数可以直接获取,并且DCT系数的高
种差异往往是由于镜头变换形成的 。 频部分经量化后基本为零,能量主要集中在左上角靠近 2基于压缩域的视频镜头检测方法
DC分量的少数几个低频系数上,使用这些极少数的低频 系数即可恢复出原图像。同时,将全部的DCT系数用作
主要分为两个步骤:1)镜头GoP检测 。抽取视频序 计算,计算量和数据量大,效率低,且意义不大。因此,选
列中每个GoP中的首帧— —I帧,以I帧中8个低频的
取8个低频DCT系数为特征值进行计算,这样既不失精
DC T系数为特征进行分区加权求二次帧差,将二次帧差
确性,同时减少了计算量,使得参与计算的数据量 减少了
与自适应阈值比较来粗略确定镜头边界所在的GoP。
7/8。在上一步分区加权的 基础上,提供了一种二次帧差
计算帧差公式为
2)镜头边界检测。根据GoP中P和B帧的 不同类型宏块
计算方法,
8 《电视技术》第38卷第13期(, ̄441期)I投稿网址h ttp://www.VideoE.cn
-
-
-
-
-
-
-
-
本文更新与2020-11-30 03:28,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/471661.html
-
上一篇:演讲稿之李真顺演讲与口才视频
下一篇:模拟昼夜的形成lv-小学科学实验视频课件