新一代数字视音频压缩节目存储系统
来源: 作者: 日期:2008-07-21 00:00:00 我要评论北京理工大学 电子工程系 陶然
北京大恒音视频技术公司 王强
摘要:随着科学技术的迅猛发展,各类信息也在迅速膨胀,尤其是在广播电视领域这个问题显得非常突出。如何高质量的保存视音频资料并使之便于检索、查询、再利用是目前的一个难题。然而,随着数字压缩技术以及多媒体技术、数字化存储技术的不断发展、完善、成熟,为开发新一代数字视音频压缩节目存储系统提供了有利条件。本文针对上述问题,对广播电视中心视音频资料的数字化压缩存储作了一定的分析、研究,并对我们已开发出的一套数字视音频压缩节目存储系统作了详细介绍。
1 引 言
在广播电视领域,随着电视频道的增加和电视台播出时间的加长,电视台每年采集和录制的电视节目迅速增加,从而造成电视台中节目存有量的迅速加大。目前国内电视台、电影资料馆的节目存储媒体主要是磁带和胶片,且记录的信号都是模拟形式。这些存储方式占用存储空间大、保存费用高、对存储环境(温度、湿度、防尘)要求高、检索不便、运输困难、保存时间短且保存质量随时间延续迅速下降。随着时间的流逝,已有许多节目资料不能再使用了,造成不可弥补的损失。因此,高质量、长时间地保存电视节目,特别是一些珍贵的资料,是电视台迫在眉睫要解决的一个问题。
随着数字化技术的发展,特别是数字视频压缩技术的不断完善,现在可以把视频信号压缩几十倍,并能保持良好的图像质量。另一方面,大容量存储媒体的出现,使得大容量的数字信号存储成为可能。数字压缩技术和大容量存储媒体为开发大容量节目存储系统创造了有利条件。基于数字光盘和MPEG-2视频压缩技术的节目存储系统,不但能提供大容量的节目存储,而且可以提供快捷的检索、查询和传送功能,另外数字光盘具有较长的保存寿命。
2 技术背景
(1)数字化的两个里程碑
数字化的第一个里程碑是CCIR601建议。所有的专家都希望,在新一代的数字演播室标准制定中,不要再将模拟电视中NTSC、PAL、SECAM三大制式三分天下的局面带进数字领域。于是,决定数字演播室采用分量编码,亮度抽样频率选为 525/60和 625/50三大制式行频的公倍数2.25MHz的 6倍即 13.5MHz,使样值有正交结构,便于数字处理,并使三大制式在数字域内的每电视行的亮度样值统一为720个,两个色度样值均为360个,即4∶2∶2格式。从而使同一格式数字录像机能记录三种不同制式的信号,并使整个数字演播室能以4∶2∶2连接在一起。
数字化的第二个里程碑是MPEG标准。MPEG是运动图像专家组的缩写(Moving Pictures Expert Group),成立于 1988年,主要活动是建立运动图像及相应标准。由这个专家组制定的标准通常称为MPEG标准。MPEG标准有MPEG-1(针对CD光盘制定的影视节目存储标准)、MPEG-2(数字电视标准)、MPEG-3和MPEG-4(多媒体应用标准)、MPEG-7(多媒体内容描述界面)。MPEG-3已和高清晰度电视专家组合并。
(2)三种压缩方式的比较
目前,MPEG-2、 M―JPEG和DV三种压缩方式被广泛应用于电视领域,它们均基于离散余弦变换(DCT),并对变换系数微量化处理后进行游程编码。主要区别是:M-JPEG和DV采用帧内压缩方式,处理费用很低,但缺少帧间预测和运动补偿所具有的高效率编码;MPEG-2采用帧间压缩、帧间预测和运动补偿技术,压缩效率大为提高,但也带来了存储器消耗量大,处理延时长等问题,不利于实现精确到帧的编辑。另外,MPEG-2和DV具有与帧内处理有关的运动自适应过程;DV只能进行固定比特率(CBR)编码,MPEG-2和M-JPEG可进行CBR和变比特率(VBR)编码。
在后期节目制作中,传统的带基线性工作方式正为盘基非线性编辑(NLE)所代替,由于零帧编辑的要求,使得M-JPEG在这一领域大放异彩。在未来数字电视广播、HDTV及更广阔的网络视频传输、多媒体通信等综合业务中,MPEG-2作为标准的地位已经不可动摇。
(3)MPEG-2
MPEG-2作为公认的压缩方案,具有标准的开放性、技术的低成本、成员间的互操作性和灵活性、比特率的可选择扩展性及众多厂商的支持等优势,在网络、通信、卫星链路等更广阔的领域被采纳。
与MPEG-1相比,MPEG-2在系统和传送方面更加详细和完善,在编码方面MPEG-2可以在场帧两种方式中进行自适应处理,而MPEG-1主要是以帧处理为主。在编人员图像输入格式方面MPEC-2比MPEG-1大大的丰富,在与原ITU-R 601建议有关的格式中定义了4∶2∶2和4∶2∶0两种格式,并同时有625和 525两种制式和25和30两种帧率。所谓4∶2∶0是指在垂直方向每隔一行去除一行色度信号。这样在保证色度信号垂直和水平清晰度相同的情况下减小一半色差信号的码率。MPEG-2还可以处理MPEG-1SIF格式。SIF格式与H.261 CIF格式不同,它具有525/625两种格式。在MPEG-2中还包括用于电影处理的3/2下拉变换,在16∶9画面中游动等功能。在系统层包括了两种规定,即传送比特流规定和节目比特流规定,而MPEG-1只有节目比特流规定。在运动检测方法上,MPEG-2只有帧预测,而MPEG-2有帧预测、场预测、双基预测和16*8场运动补偿方式。在DCT系统输出方式上MPEG-2有两种方式即ZIGZAG方式和交替方式;而MPEG-1只有一种方式。在量化方式上MPEG-2有线性和非线性方式两种,MPEG-1也只有线性一种。霍夫曼编码表对于MPEG-2也有两种。由此看来MPEG-2在各方面对MPEG-1有许多改进。
3 MPEG-2视音频采集卡
电视中心节目光盘存储系统的关键技术是电视节目的压缩、记录和查询利用。MPEG-2视音频采集卡是电视节目压缩的核心。在C-Cube公司的新一代编码芯片E4的基础上开发MPEG-2视音频采集卡,可按 4∶2∶2(MP@ML)及4∶2∶0(MP@ML)可变码率进行编码,视音频板卡的输出码流为PS流或TS流。压缩后的数据码流通过光盘写入系统记录在数字光盘上。从电视节目存储的成本考虑,选择市场上已有的DVD-R、DVD-RAM等数字光盘作为电视节目存储的记录媒体,但数字光盘上记录的码流格式与DVD格式不相同。
主要技术指标是:
视频输入格式: D1(ITU-R 601)、模拟复合、模拟分量
输入图像格式:720 × 576(PAL), 720×480(NTSC)
编码格式:4∶2∶2及4∶2∶0 (MP@ML)
图像和声音质量:高于“数字卫星传输系统指标要求”
输出码流:PS流或TS流。
(1)MPEG-2视音频采集卡
此采集卡是基于 PCI总线的,因此可方便地配置在微机中组成一套成本低、质量高的音视频系统。通过该卡可将外来的视、音频信号(模拟或数字)经MPEG-2压缩后形成标准的MPEG-2码流,并将之直接保存在硬盘或DVD光盘上,通过为该板卡开发的用户应用软件可对保存在硬盘中的码流实现编辑、检索等功能。
此板卡主要应用于基于PCI总线上低成本的音视频编解码环境中,它可接受N制或PAL制信号,输入格式可为模拟复合和模拟分量,还接受SDI 4∶2∶2数字视频信号。板卡根据下载的不同微码不仅可应用在广播系统中、低延时的视频通信中,还可用于数字视频广播系统、节目分配系统、节目授权、非线形编辑和低延时的视频通信。配合高性能的微机和DVD-RAM可组成一台功能完备的基于PC的非线性编辑系统。
(2)DVEXPRESS芯片内部结构
该采集卡的核心芯片是C-CUBE公司最近推出的MPEG-2视频压缩芯片DVEXPERT。该芯片是 C-CUBE 公司的最新研究成果,可单片实时完成运动估计、运动补偿、 DCT变换等复杂的 MPEG-2压缩算法,并配合 C-CUBE自己开发的 PREFED VIEW算法,可实现帧精度控制。它将精确到帧的 MPEG- 2编辑技术(FAME)、多数据解码、MPEG-2高压缩比及实时特技等集成于一块芯片中,通过硬件支持和有时码驱动的应用程序接口(API)来实现 MPEG-2编辑。开始、暂停、继续、停止、剪辑、寻找、擦除等功能都独立于GOP,因此,很适于硬盘录像机(DDR)和非线性编辑的操作。
在GOP结构上,民用高端芯片DVxpreSS7110采用的是I、IP、IBBP(4∶2∶0),最大比特率为15Mb/s;专业视频应用的 DVxpress7112还采用了I、IP、IB(4∶2∶2),最大比特率可达50Mb/s。二者都可任选CBR和VBR编码,其中VBR能更有效地利用硬盘存储空间。
该芯片主要由主控CPU(MICROSPARC)、协处理器、视频接口、音频接口、SDRAM接口等模块组成。



