*文本和图形;
*文本和图形;
*用来合成语言和运动头部的正在讲话的合成的头部和相关的文本;
*合成的声音
编码形式的媒体对象是由在语音视频景象中处理该对象的描述元素和相关流数据组成。重要的是在编码形式下每个媒体对象都能独立与它的环境或背景独立表现。考虑到要求的功能,这种媒体对象的编码表示法是尽可能的高效的。这些功能包括差错鲁棒性、易释性和可编辑性。
2。2。2媒体对象的组合
基本媒体对象相应于描述树中的叶子,而组合媒体对象包含了整个子树。例如:相应于正在说话的人的视频对象和相应的声音捆绑在一起形成一个新的组合媒体对象,包含了那个人的语音和视频部分。
*这样的组成允许作者构建复杂的景象,使客户能处理有意义的对象。
*更普遍地,MPEG-4提供了一种描述景象的标准化方式,例如允许:
*在给定坐标系内随处放置媒体对象;
*应用变换来改变媒体对象的几何和声学表现;
*整合基本媒体对象以形成组合媒体对象;
*应用流数据于媒体对象以更改属性(例如声音,属于某对象的移动中的文本,驱动合成面孔的动态参数成面孔的动态参数;
*交互式地改变用户在景象中的任何视听点。
景象描述是建立在来自于对象合成结点的结构和功能意义上的虚拟现实(VRML)的一些基本概念而且扩展为完全实现上述特点。
2。2。3媒体对象流数据的描述和同步
一个MPEG-4影音场景的例子媒体对象可能需要在一个或多个基本流中传输的流数据。对象描述符把与媒体对象相关的所有流中区分开来。这就允许处理分层编码数据、内容变化信息的联系(称?quot;对象内容信息")和相关的知识产权。每个流自身由一套配置信息的描述符所区别,例如用来决定需要编码源和编码的时间信息精度。而且描述符可以携带传输需要的QoS的线索(例如最大位速率、位差错速率、优先级等)。基本流的同步是通过基本流内单个访问单元的时标实现的。同步层管碚庋的访问单元和时标的识别。独立于媒体类型之外,该层允许识别出访问单元的类型恢复媒体对象或景象描述的时基,而且能在其间实现同步。该层的语法可以多种方式配置,允许在许多系统中使用。
2。2。4流数据的传输
在不同QoS的网络中从源到目的的流信息的同步传输,是由上述的同步层和包含两子层的复合传输层确定的。第一个复用层根据MPEG-4标准的Part6中的DMIF规范进行管理。这种复用可在MPEG定义的FlexMux工具中体现,该工具允许以低复用费用组合基本流(ESS)。例如该层的复用可用来组合相似QoS需求的基本流,减少网络连接数或者端-端延迟,TransMux(传输复用)层搭建了提供匹配需求QoS的传输服务的层。MPEG-4仅确定了该层的接口而具体的数据包和控制信号的规划必须与各传输协议上有权的实体进行协商。任何现存的合适的传输协议栈,例如(RTP)/UDP/IP、(AAL5)/ATM或者MPEG-2在适合链路层上的传输流都可能成为TransMux的实例。选择权留给了最终用户和服务提供商,而允许MPEG-4用于广泛的运行环境中。
FlexMux复用工具的使用是可选的,如果下层的TransMux实例提供了所有要求的功能,该层必须为空。而同步层总是存在的。以下是可行的:
1.识别访问单元,传输时标和时钟参考信息以及检测数据丢失;
2.传输控制信息以实现:
*为每个基本流和FlexMux流指示需要的QoS;
*翻译这样的QoS需求为实际网络资源;
*连接基本流到媒体对象;
*转换基本流的映射为FlexMux和TransMux通道。
部分控制功能在和DMIF框架这样的传输控制实体联结后才可实现。
2。2。5与媒体对象交互
总体来说用户看到的是依据作者设计组合而成的影象。然而,用户和影象交互的可能性依赖于作者所允许的自由度。用户可能被允许进行的操作包括:
*改变景象的视/听点,例如在景象中漫游;
*把景象中的对象拖到不同的位置上;
*点击特定对象以触发一系列事件,例如开始或终止视频流;
*多语言音轨时选择想要的语言。
更复杂的动作也能被触发,例如一个虚拟的电话铃响,用户接听并建立通信链路。
2。2。6知识产权的管理和识别
能够在MPEG-4媒体对象中识别出知识产权是重要的。为支持这一点,MPEG与不同制造商的代表就语法定义和工具进行合作。MPEG-4通过存储唯一标识来实现识别,该标识由国际编号系统公布。该数字可用于识别媒体对象的当前所有者。因为并非所有的内容都由此数字识别,MPEG-4Version1提供用关键值对来识别知识产权的可能。而且MPEG-4为想使用控制访问知识产权的系统的人提供一个紧密结合进系统层的标准化系统的人提供一个紧密结合进系统层的标准化接口。通过该接口,所有权控制系统可轻易地与解码器的标准化部分组合。
2。3MPEG-4标准的技术细节
显示了从网络(或存储设备)来的流作为TransMux流,复用为FlexMux流并传给适当的获取基本流的FlexMux解复器的。基本流(ES)被解析并传递给适当的解码器。解码是从编码形式中恢复出AV对象中的数据并进行必要的操作以重建初始的AV对象以备在适当设备上演示。重建的AV对象可为影象演示中的潜在需要组合成层。解码的AV对象和影象描述信息都被用来组合作者所描述的影象。用户可在作者允许的程度上与最终演示展现的影象交互。
2。3。1传输多媒体集成框架DMIF
传输多媒体集成框架DMIF(DeliveryMultimediaIntegrationFramework)是在通用传输技术上的管理多媒体流的会话协议。原理上与FTP相似,唯一也是基本的差别是FTP返回数据,DMIF返回获取(流)数据的指针。类似地,当DMIF运行时,第一个动作是和远端建立会话。然后,选择流并发要求(request)流注,DMIF对端将返回连接流注点的指针,并建立连接。
MPEG-4终端(接收侧)的主要部分与FTP相比,DMIF既是框架又是协议。DMIF提供的功能是由称为DMIF应用接口(DAI)的接口来表达,并翻译为协议消息。这些协议消息可能基于运行的网络而不同。服务质量同样为DMIF设计所考虑,DAI允许DMIF用户为所需的流指定要求。这样就要求DMIF执行时保证要求得以实现。DMIF规格提供了在几个新网络类型,例如Internet上实现该任务的线索。(责任编辑:一枝笔写作)