MPEG-1
MPEG-1的概论MPEG-1是MPEG组织制定的第一个视频和音频有损压缩标准。视频压缩算法于1990年定义完成。1992年底,MPEG-1正式被批准成为国际标准。MPEG-1是为CD光碟介质定制的的视频和音频压缩格式。一张70分钟的CD光碟传输速率大约在1.4Mbps。而MPEG-1采用了块方式的运动补偿、离散馀弦变换(DCT)、量化等技术,并为1.2Mbps传输速率进行了优化。MPEG-1随后被Video CD采用作为核心技术。MPEG-1的输出质量大约和传统录像机VCR,信号质量相当,这也许是Video CD在发达国家未获成功的原因。
MPEG-1音频分三层,分别为MPEG-1 Layer1,MPEG-Layer2以及MPEG-Layer3,并且高层兼容低层。其中第三层协议被称为MPEG-1 Layer 3,简称MP3。MP3目前已经成为广泛流传的的音频压缩技术。
MPEG-1 Layer1采用每声道192kbit/s,每帧384个样本,32个等宽子带,固定分割数据块。子带编码用DCT(离散余弦变换)和(快速傅立叶变换)计算子带信号量化bit数。采用基于频域掩蔽效应的心理声学模型,使量化噪声低于掩蔽值。量化采用带死区的线性量化器,主要用于数字盒式磁带(DCC)。
MPEG-1 Layer2采用每声道128kbit/s,每帧1152个样本,32个子带,属不同分帧方式。采用共同频域和时域掩蔽效应的心理声学模型,并对高、中,低频段的比特分配进行限制,并对比特分配、比例因子,取样进行附加编码。Layer2 广泛用于数字电视,CD-ROM,CD-I和VCD等。
MPEG-1 Layer3采用每声道64kbit/s,用混合滤波器组提高频率分辨率,按信号分辨率分成6X32或18X32个子带,克服平均32个子带的Layer1,Layer2在中低频段分辨率偏低的缺点。采用心理声学模型2,增设不均匀量化器,量化值进行熵编码。主要用于ISDN(综合业务数字网)音频编码。
MPEG-1制定于1992年,为工业级标准而设计,它可针对SIF标准分辨率(对于NTSC制为352X240;对于PAL制为352X288)的图像进行压缩,传输速率为1.5Mbits/sec,每秒播放30帧,具有CD(指激光唱盘)音质,质量级别基本与VHS相当。MPEG的编码速率最高可达4- 5Mbits/sec,但随着速率的提高,其解码后的图象质量有所降低。
MPEG-1也被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL),视频点播(VOD),以及教育网络等。同时,MPEG-1也可被用做记录媒体或是在INTERNET上传输音频。
MPEG-1的运用MPEG-1曾经是VCD的主要压缩标准,是目前实时视频压缩的主流,可适用于不同带宽的设备,如CD-ROM、Video-CD、CD-I。与M-JPEG技术相比较,在实时压缩、每帧数据量、处理速度上均有显著的提高。MPEG1可以满足多达16路以上25帧/秒的压缩速度,在500kbit/s的压缩码流和352像素×288行的清晰度下,每帧大小仅为2k。若从VCD到超级VCD到DVD的不同格式来看,MPEG1的352 ×288格式,MPEG2可有576×352、704 ×576等,用于CDROM上存储同步和彩色运动标视频信号,旨在达到VCR(模拟式磁带录放机Video Cassette Recorder;VCR)质量,其视频压缩率为26:1。MPEG1可使图像在空间轴上最多压缩1/38,在时间轴上对相对变化较小的数据最多压缩1/5。MPEG1压缩后的数据传输率为1.5Mbps,压缩后的源输入格式SIF(Source Input Format),分辨率为352像素×288行(PAL制),亮度信号的分辨率为360×240,色度信号的分辨率为180×120,每秒30帧。MPEG1对色差分量采用4:1:1的二次采样率。MPEG1、MPEG2是传送一张张不同动作的局部画面。在实现方式上,MPEG1可以借助于现有的解码芯片来完成,而不像M-JPEG那样过多依赖于主机的CPU。与软件压缩相比,硬件压缩可以节省计算机资源,降低系统成本。
但也存在着诸多不足。一是压缩比还不够大,在多路监控情况下,录像所要求的磁盘空间过大。尤其当DVR主机超过8路时,为了保存一个月的存储量,通常需要10个80G硬盘,或更多,硬盘投资大,而由此引起的硬盘故障和维护更是叫人头疼。二是图像清晰度还不够高。由于MPEG1最大清晰度仅为352 X 288,考虑到容量、模拟数字量化损失等其它因素,回放清晰度不高,这也是市场反应的主要问题。三是对传输图像的带宽有一定的要求,不适合网络传输,尤其是在常用的低带宽网络上无法实现远程多路视频传送。四是MPEG1的录像帧数固定为每秒25帧,不能丢帧录像,使用灵活性较差。从目前广泛采用的压缩芯片来看,也缺乏有效的调控手段,例如关键帧设定、取样区域设定等等,造成在保安监控领域应用不适合,造价也高。
总体看来M-JPEG与MPEG1由于技术成熟,是目前DVR市场的主流技术,但两者的致命弱点就是硬盘耗费量大,且不能同时满足保安与实时录像场合的需要。
MPEG-1的特点随机访问,灵活的帧率 、可变的图像尺寸 、定义了I-帧、P-帧和B-帧 、运动补偿可跨越多个帧 、半像素精度的运动向量 、量化矩阵 、GOF结构 、slice结构 、技术细节、输入视频格式。
MPEG-1的参数最大像素数/行:720
最大行数/影格:576
最大影格/秒:30
最大宏块/影格:396
最大宏块/秒:9900
最大位元率:1.86Mbps
最大解码缓冲区尺寸:376832bit。
MPEG-1资料结构和压缩模式MPEG-1可以按照分层的概念来理解,一个MPEG-1视频序列,包含多个GOP,每个GOP包含多个帧,每个帧包含多个slice。
影格是MPEG-1的一个重要基本元素,一个影格就是一个完整的显示图像。影格的种类有四种:
I-图像/影格(节点编码图像,intra coded picture)参考图像,相当于一个固定影像,且独立於其它的图像类型。每个图像群组由此类型的图像开始。编码时独立编码,仅适用帧内编码技术,因而解码时不参考其他帧,类似JPEG编码。
P-图像/影格(预测编码图像,predictive coded picture)包含来自先前的 I 或 P-画格的差异资讯。编码时使用运动补偿和运动估计,采用前向估计,参考之前的I-帧或者P-帧去预测该P格。
B-图像/影格(前后预测编码图像,bidirectionally predictive coded pictures)包含来自先前和/或之后的 I 或 P-画格的差异资讯。编码也使用运动补偿和运动估计,预估采用前向估计、后向估计或是双向估计,主要参考前面的或者后面的I格或者P格。
D-图像/影格(指示编码图像,DC direct coded picture)用於快速进带。仅由DC直流分量构造的图像,可在低比特率的时候做浏览用。实际编码中很少使用。