MPEG

本文擷至網路

　　在1990年底，MPEG ( Motion Picture Experts Group)委員會制定了MPEG-1標準，以位元率 (target bitrate) 1.5 Mbits/sec 做為影音壓縮的目標，以提供VHS視訊和CD音訊品質之服務。隨後，MPEG-2標準也被制定出來，提供更高的位元率及更佳的品質，可提供直播衛星和高畫質電視 (High Definition Television; HDTV) 等需要高品質影音訊號的應用。

　　在傳統的視訊壓縮中，以一連串的影像(image)為壓縮對象，也就是對於一整張畫面(frame)做資料壓縮。如此會將整張畫面不重要的部分，如：單調的背景，也一起壓縮進去而佔有一定程度的資料量(example 1)。因此，不利於低位元率 (very low bitrate) 環境之應用。此外，對於其它形態的影音資料 (audiovisual data)，如：文字，並沒有一個統一的標準，因而使得互動式電視 (interactive TV) 缺乏一套有系統與有效率的標準。所以，MPEG委員會的成員，達成一個共識：MPEG-4將以物件為基礎 (object-based) 的壓縮方式來打破目前的限制(example2)，並將開發更多的多媒體應用。

定義：
MPEG-4包含四個重要的部分：
1.系統 (System) 定義影音資料和其它資料如何融合(multiplexing)在一起，以及在網路上如何傳輸。MSDL(MPEG-4 System Description Language ) 用來傳送和連結物件的額外資訊。

2.視訊 (Natural Video) 會把目標位元率設定於5 - 64 kbps和2 Mbps以上，以達到不同應用上所需求的頻寬。

3.音訊 (Natural Audio) 目標位元率設定於2 - 64 kbps ，將會由數個不同的音訊壓縮演算法組成，以達到整個目標位元率的範圍。

4.電腦合成資料 (Synthetic-Natural Hybrid Codin; SNHC) 主要以電腦合成的資料為範疇，包括了VRML和真人語音系統 ( Text To Speech ， TTS ) 。MPEG-4 正式發表標準前，此部分將會個別合併到視訊和音訊部分。

MPEG 4 簡介

　　MPEG-4 視訊驗證原型 ( Verification Model ) ，到今年四月已經更新到7.0版。每次的更新都會將實驗結果較好的方法加入新版而取代舊有的方法，目前已發表了較正式的工作草案 ( Working Draft 3.0 )， MPEG-4 視訊標準大致的架構已經成型。

在此驗證原型中，一個畫面將可視為是由多個視訊物件 ( Video Object ) 所組成，如此將可提供很高的使用者互動性，用以開發更多的應用。使用者可自由存取操作這些視訊物件，而組成自己想要的畫面。

　　每一個視訊物件還可分層 ( Layer ) ：基礎層 ( Base Layer ) 提供較低的解析度，加強層 ( Enhancement Layer ) 提供較高的解析度。每一層由真正影像的實體：視訊物件平面 ( Video Object Plane，VOP ) 所構成，視訊物件平面則包含了物件形狀 ( shape ) 和材質 ( textual ) 的資料。

媒體物件的組成
MPEG-4影音場景由不同的物件所組成，每個物件之間的關聯，可以建立出樹狀的結構圖

互動式的媒體物件
一般而言，使用者看到場景的組成，是由該場景的作者所設計出來的。場景的作者，可以設定或限定任意的自由度，讓使用者再充分授權下與該場景產生互動。一個使用者可能被允許的操作包括：
1.改變自己在場景中的視覺或聽覺的位置，就好像在場景中航行。
2.將物件放置在不同的位置。
3.產生一連串的事件觸發特定的物件，如開啟或停止video stream。
4.當有提供多重語言支援的時候，選擇想要的語言模式。

MPEG-4視訊解碼器
1.MPEG-4的視訊解碼器主要可分三個部份：分工器 ( DEMUX)
2.視訊物件解碼器 ( Video Object Decoder )
3.構圖器 ( Composer )

視訊解碼器利用網頁瀏覽器執行解碼器的狀況：使用者可直接拉動件，擺在想要的位置，並藉由左邊的按紐，改變物件大小，物件解析度(SP)，以及物件畫面數(TM)

MPEG-4視訊編碼器
MPEG-4的視訊編碼器主要可分二個部份：
1.視訊物件編碼器 ( Video Object Encoder )
2.融合器 (MUX )

視訊編碼器可針對不同的視訊物件，予以個別獨立之壓縮
可提供可調整性壓縮：

1.空間上的可調整性 ( Spatial Scalability )：空間上的可調整性可以改變某一個視訊物件的解析度；最低解析度的當做基礎層，以上都是加強層，如此分層即可達到不同解析度的壓縮。

2.時間上的可調整性 ( Temporal Scalability ):
時間上的可調整性可以改變某一個視訊物件的播放速率，時間上的可調整性不必如空間上的可調整性做縮放影像大小的工作，僅需將某些時間的影像放到加強層即可。

DMIF

DMIF(Delivery Multimedia Integration Framework)是 session protocol 用來管理多媒體的資料流。在原理上，DMIF 與 FTP 相類似，不同在於，FTP傳遞使用者選擇的檔案，而 DMIF 傳遞使用者選擇的 Object Stream。DMIF提供的功能介面被稱為 DMIF-Application Interface(DAI)，DAI 在規格上定義為可在一些 Network types 上運作，如 Internet。也可以存取 broadcast material 與 local files。因此它的意思是，單一的介面被定義為可以在不同的傳輸技術(通訊媒體)上存取多媒體資料。

因此 DMIF 涵蓋三個主要領域，interactive network technology、broadcast technology 與 disk technology，

在這樣的架構下，使得 applications 依賴 DMIF 來通訊，而不管 DMIF 是經由什麼通訊方法來取得連線。所以，在 DMIF 的 implementation 上，必須提供一個簡單的 interface 給應用程式。

MPEG的新發展－－MPEG4、MPEG7網絡應用最重要的目標之一就是進行多媒體通信。多媒體信息主要包括圖像、聲音和文本三大類，其中視頻、音頻等信號的信息量是非常大的。而且這些信息的表達方式、輸入、輸出的要求也各不相同，因此在多媒體通信中，對這些數據進行有效的表達和適當處理是非常重要的。其中，多媒體信息的壓縮技術是多媒體通信領域的關鍵技術之一。MPEG（MovingPictureExpertGroup）應運而生，它是ISO（InternationalStandardOrgnization）與IEC（InternationalElectronicCommittee）於1988年聯合成立的，致力於運動圖象及其伴音編碼標準化工作。它包括MPEG系統，即MPEG視頻及MPEG音頻。原先共有三個版本MPEG1、MPEG2、MPEG3，後又增加了MPEG4、MPEG7，不同版本表示了不同用途和質量，對多媒體通信的發展起到了革命性的推動作用

一、MPEG1、MPEG2和MPEG2AACMPEG1（ISO/IEC11172）制定於1993年，是針對1.5Mbps以下數據傳輸率的數字存儲媒質運動圖像及其伴音編碼的國際標準。MPEG1用於在CD—ROM上存儲同步和彩色運動視頻信號。可優化為中等分辨率，並在其優化模式下，採用所謂的標準交換格式（SIF）。MPEG1對色差分量採用4?1?1的二次採樣率。MPEG1旨在達到VRC質量，其視頻壓縮率為26?1。MPEG1現已成為常規視頻標準的一個子集，該子集稱為CPB流。

1995年又出台了MPEG2（IOS/IEC13818），它追求的是CCIR601建議的圖象質量DVB、HDTV和DVD等制定的3Mbps?10Mbps的運動圖象及其伴音的編碼標準。該標準最初的目的是在與MPEG1兼容的基礎上，實現低碼率和多聲道擴展。后為適應演播電視要求，MPEG於1994開始致力於定義一個可以獲得更高質量的多聲道音頻標準。該標準不與MPEG1兼容，定名為MPEG2AAC。AAC標準完成於1997年，經BBC（U.K.）和NHK（Japan）使用、測試表明已達到最優化ITU—R601推荐的分辨率。AAC（AdvancedAudioCoding）對於低比特率的多聲道編碼能提供相當高的聲音質量。由於它不向后兼容，故具有更高的壓縮效果。據測試它以320Kbps傳送的音頻信號比MPEG2以640Kbps傳送的音質還略好些。AAC標準的發展標志著標準化工作向著模塊化方向演變的趨勢。

MPEG3是ISO/IEC最初為HDTV開發的編碼和壓縮標準。但由於MPEG2的高速發展，MPEG3的功能已被淘汰，其原來的工作由MPEG2小組承擔。

二、MPEG4與前兩者不同，於1998年11月公布，原預計1999年1月投入使用的國際標準MPEG4不僅是針對一定比特率下的視頻、音頻編碼，更加注重多媒體系統的交互性和靈活性。MPEG4試圖達到兩個目標：一是低比特率下的多媒體通信；二是多工業的多媒體通信的綜合。據此目標，MPEG4引入AV對象（Audio/VisaulObjects），使得更多的交互操作成為可能。1.AV對象（AVO）

AV對象的基本單位是原始“AV對象”，它們可能是一個沒有背景的說話的人，也可能是這個人的語音或一段背景音樂等。它具有高效編碼、高效存儲與傳播及可交互操作的特性。

在MPEG4中，AV對象有著重要的地位。MPEG4對AV對象的操作主要有：

1採用AV對象來表示聽覺、視覺或者視聽組合內容。

2允許組合已有的AV對象來生成復合的AV對象，並由此生成AV場景。MPEG4採用SNHC的方法來組織這些AV對象。

3允許對AV對象的數據靈活地多路合成與同步，以便選擇合適的網絡來傳輸這些AV對象數據。

4允許接收端的用戶在AV場景中對AV對象進行交互操作。

5MPEG4支持AV對象知識產權與保護。

2.MPEG4標準的構成

1）DMIF（TheDelliveryMultimediaIntegrationFramework）

DMIF即多媒體傳送整體框架，它主要解決交互網絡中、廣播環境下以及磁盤應用中多媒體應用的操作問題。通過傳輸多路合成比特信息來建立客戶端和服務器端的握手和傳輸。通過DMIF，MPEG4可以建立起具有特殊品質服務（QoS）的信道和面向每個基本流的帶寬。

2）數據平面

MPEG4中的數據平面可以分為兩部分：傳輸關系部分和媒體關系部分。

為了使基本流和AV對象在同一場景中出現，MPEG4引用了對象描述（OD）和流圖桌面（SMT）的概念。OD傳輸與特殊AV對象相關的基本流的信息流圖。桌面把每一個流與一個CAT（ChannelAssosiationTag）相連，CAT可實現該流的順利傳輸。

3）緩沖區管理和實時識別

MPEG4定義了一個系統解碼模式（SDM），該解碼模式描述了一種理想的處理比特流句法語義的解碼裝置，它要求特殊的緩沖區和實時模式。通過有效地管理，可以更好地利用有限的緩沖區空間。

4）音頻編碼

MPEG4的優越之處在於，它不僅支持自然聲音，而且支持合成聲音。MPEG4的音頻部分將音頻的合成編碼和自然聲音的編碼相結合，並支持音頻的對象特征。

5）視頻編碼

與音頻編碼類似，MPEG4也支持對自然和合成的視覺對象的編碼。合成的視覺對象包括2D、3D動畫和人面部表情動畫等。

6）場景描述

MPEG4提供了一系列工具，用於組成場景中的一組對象。一些必要的合成信息就組成了場景描述，這些場景描述以二進制格式BIFS（BinaryFormatforScenedescription）表示，BIFS與AV對象一同傳輸、編碼。場景描述主要用於描述各AV對象在一具體AV場景坐標下，如何組織與同步等問題。同時還有AV對象與AV場景的知識產權保護等問題。MPEG4為我們提供了豐富的AV場景。

3.應用前景

MPEG4的應用前景將是非常廣闊的。它的出現將對以下各方面產生較大的推動作用：數字電視；動態圖象；萬維網（WWW）；實時多媒體監控；低比特率下的移動多媒體通信；於內容存儲和檢索多媒系統；Internet/Intranet上的視頻流與可視游戲；基於面部表情模擬的虛擬會議；DVD上的交互多媒體應用；基於計算機網絡的可視化合作實驗室場景應用；演播電視等。

三、MPEG7—多媒體內容描述接口繼MPEG4之后，要解決的矛盾就是對日漸龐大的圖像、聲音信息的管理和迅速搜索。針對這個矛盾，MPEG提出了解決方案MPEG7。MPEG7力求能夠快速且有效地搜索出用戶所需的不同類型的多媒體料。該工作提議於1998年10月提出，預計於2001年初最終完成並公布。MPEG7將對各種不同類型的多媒體信息進行標準化的描述，並將該描述與所描述的內容相聯系，以實現快速有效的搜索。該標準不包括對描述特征的自動提取，它也沒有規定利用描述進行搜索的工具或任何程序。其正式的稱謂是“多媒體內容描述接口”。MPEG7可獨立於其它MPEG標準使用，但MPEG4中所定義的對音、視頻對象的描述適用於MPEG7，這種描述是分類的基礎。另外我們可以利用MPEG7的描述來增強其它MPEG標準的功能。MPEG7的應用範圍很廣泛，既可應用於存儲（在線或離線），也可用於流式應用（如廣播、將模型加入Internet等）。它可以在實時或非實時環境下應用。如：數字圖書館（圖象目錄，音樂字典等）；多媒體名錄服務（如黃頁）；廣播媒體選擇（無線電信道，TV信道等）；多媒體編輯（個人電子新聞業務，媒體寫作）等。另外，MPEG7在教育、新聞、導游信息、娛樂、研究業務、地理信息系統、醫學、購物、建築等各方面均有較深的應用潛力。四、結束語與同樣是音頻壓縮標準的杜比公司的AC系列標準相比，MPEG標準系列由於存在專利權的問題，所以更適合於我國國情。MPEG1使得VCD取代了傳統的錄象帶，而MPEG2將使數字電視最終完全取代現有的模擬電視，而高畫質和音質的DVD也將取代現有的VCD。隨著MPEG4和MPEG7新標準的不斷推出，數據壓縮和傳輸的技術必將趨向更加規範化。

搜尋此網誌

B.C.T.C. | 布魯斯瘋

MPEG

留言

張貼留言

這個網誌中的熱門文章

Pligg_Beta_9.9.0

流年斗君算法

紫微斗數守護神