有些多媒体业务需要提供面向对象的操作和编辑功能,如远程数据库访问、视频编辑等。有些情况下,人们只对场景中的某个对象感兴趣,如多媒体会议,人们感兴趣的只是与会者的头肩像,而不关心背景。因此,为了节省带宽,可以只传送头肩像的视频信息,接收端再把收到的头肩像信息解码重建,并置于一间虚拟会议室中。基于内容的视频编码系统可以在比特流层支持这种基于对象的访问和操作功能。
有两种类型的视频编码系统支持基于内容的交互性,一种是模型基编码;另一种是在传统的基于块的视频编码系统的基础上扩充而成的。对于前者,在此不做讨论。而后者则是传统的,基于块的混合运动预测/补尝编码系统扩展到任意形状的视频序列而成的。传统的、基于块的编码方法已被MPEG-1/2和H。261/3等标准所采用。这种系统主要由场景分析和对象分割、形状编码、运动编码、纹理编码等模块构成,具体的编码算法则做为实现系统中各个功能模块的工具,可根据实际需要选取组合。首先对输入的原图像序列进行场景分析和对象分割,以划分不同的VOP,得到各个VOP的形状和位置信息。VOP的形状和位置信息可以用上文提到的alpha平面来表示。发送端只需传送alpha平面,接收端就可以确定VOP的形状和位置。alpha平面所需的比特数是比较多的,需要进行压缩编码。显然,只要对VOP的轮廓进行编码和传送,接收端就可以恢复alpha平面,轮廓信息在轮廓编码器中进行编码。提取出的形状和位置信息又用来控制VOP的运动和纹理编码。对运动和纹理信息编码仍然采用经典的类似停校牛呛虷。261/3标准的运动预测/补偿法。输入的第N帧的VOP与帧存储器中存储的N-1帧的VOP进行比较,找到运动矢量,然后对两帧VOP的差值进行量化、编码。对不同对象的运动和纹理信息的编码可因地制宜地采用不同的方法,以提高编码效率。编码后得到的纹理信息,与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码,形成各自的比特流层,经复接后在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。当VOP的形状为矩形时,不需要进行形状编码,该系统退化为传统的规则形状的视频编码系统,保持了后向兼容性基于内容的视频编码技术,可以对任意形状的视频对象序列进行编码,编码后的视频对象的比特流以"对象层"的形式而存在。同一场景中的不同视频对象可分别独立地进行编码和传输,因此,接收端可独立地有选择地解码和重建视频对象,也可灵活地在比特流层对视频对象进行操作而改变原场景。基于内容的视频编码技术在远程监控、移动多媒体、信息娱乐(infotainment)、多媒体会议、交互购物、电影和电视的后期制作、虚拟现实、计算机支持的协同工作(CSCW)等领域具有十分广阔的应用前景,它必然对多媒体事业产生巨大的冲击
三.应用部分
3。1MPEG-4技术动态
ACTS是欧洲的一个研究与技术开发组织,其MCM子组的工作与MPEG-4系统、算法和工具、脸部特征跟踪及动画等密切相关。目前项目研究和开发一族PSTN等低比特率可视电话视频编码算法,允许异质网间视频会议的比特流可伸缩性。
VIDAS项目为时间相关表现、编码和AV流操纵设计一个合适算法,在可视电话场景(编码器)分析、(解码器)合成时充分利用语音和脸动的相关性,在真实帧之间插入合成帧提高帧率,平滑显示与语音同步的唇部运动,面向分布式创作和分布式虚拟现实。蓝室(BlueRoom)、计算机、合成三者可分布在不同地点,蓝室视频信号、控制信号和跟踪信号由远地传来,而背景和动画则在本地实时绘制,它们与蓝室视频信号合成后生成最终信号。分布式虚拟现实系统中一次性传送基本3D模型,然后只传输动态交互引起的模型变化量,人们通过高速网络可以在虚拟世界里交互。最近东芝公司推出首款基于MPEG-4视频流系统MobileMotion套件,包括Motion套件,包括MPEG-4产品、服务器和播放器软件,用于Internet/Intranet上构建视频和多媒体应用,支持CIF和亚1/4CIF,6kbps-384kbps时每秒可处理30帧视频数据。
3。2MPEG-4及其在VOD业务中的应用
视频点播是近年发展起来的基于多媒体技术的交互式服务方式,VOD是以数字压缩技术为基础、网络与多媒体技术相结合的交互电视系统。VOD业务是指用户可以从自己的终端(机顶盒、普通模拟电视机)上申请所需信息,提供服务的部门按用户需要提供有关信息。VOD业务主要有影视选播、电视购物、远程教学、远程医疗、电子图书馆和交互式电子游戏等。目前流行的VOD系统主要采用MPEG-2编码标准。这种标准的画面质量好,压缩比高。然而MPEG-2标准在VOD业务的应用中也暴露出其不足方面:基于宏块和帧的编码方式限制了对内容的交互操作、压缩效率仍不理想、窄带网上的传输质量受到限制和对媒体的兼容能力有待提高等。因此VOD业务的发展急需一种以多媒体应用为目标的新一代编码标准。
MPEG-4基于对象编码的技术特点和它可实现的功能,在VOD业务中有很大的应用潜力。同采用MPEG-2标准的VOD业务相比,基于MPEG-4的VOD业务具有以下特点:
(1)图像主观质量更好由于采用基于视频对象的编码方式,编码时可以根据人眼的视觉特性,区分不同视频对象的主次关系,合理安排压缩比。与现存的标准相比,这种编码方式容易获得更好的图像主观质量。
(2)交互性更完善
MPEG-4VOD用户突破了传统上基于帧进行操作的限制,可以根据各自的需求,针对帧中的某一个视频对象,进行平移、旋转、缩放、剪帖和检索等交互式操作,使交互性能有了质的飞跃。这种基于对象的交互操作,使用户能根据某一具体画面(如某种植物)查询相关内容,或是查询画面中某一物质对象的其它资料(即VOD电子图书馆业务)。用户还可放大自己存放在医院的X光照片,取出自己关心的那部分画面仔细观察(即VOD远程医疗业务)等等。
(3)灵活性更大
VOD业务部门可以根据不同地域的具体条件、使用不同的传输网络(如HDSL、ADSL、HFC和FTTH/FTTC等),开展VOD业务。VOD用户也可以对音/视频的质量、实时性和接入网方式等作自由选择。
(4)多媒体兼容能力更强
MPEG-4不但支持自然音频、视频,而且支持自然和合成的混合音频、视频。在VOD电子游戏中,用户可以利用自然的音频和视频创作动画和合成声音。在VOD影视节目点播中,用户可以在画面上选择叠加自己母语的字幕,或者叠加其它文字信息(如股票行情等)。(责任编辑:一枝笔写作)