雖然數碼相機 (DSC) 投入市場僅幾年時間,但已經使消費類電子成像業發生了翻天覆地的變化。目前,全球售出的相機中大約有三分之一是數碼相機,而且其份額還在穩步上升。隨著多兆象素DSC生成分辨率越來越高的圖像而開始挑戰傳統的膠卷像機,消費類DSC也正提供智能化操作模式,幫助用戶在各種條件下都能拍攝出更好的照片。視頻模式也已經成為消費類 DSC的標準功能,使用戶能夠快速拍攝多個照片,以便選擇更好的快照,同時也使他們能夠保存重大事件的簡短剪輯。此外,DSC 也開始與手機集成在一起,實現靜止圖片與剪輯隨時隨地的快速傳輸。
隨著瞬息萬變的 DSC 市場不斷分化,開發商必須不斷充分利用技術創新的優勢來細分其產品。當今其中一項創新就是在基于高性能數字信號處理器 (DSP) 的消費類 DSC 中引入 MPEG-4 視頻壓縮技術。MPEG-4標準使 DSC 能夠有效提供視頻及其他操作模式,增加所存儲視頻剪輯的數量,并支持視頻圖像強大可靠的傳輸。DSP可以提供低價位相機產品中 MPEG-4 編碼以及解碼所需要的計算性能,尤其那些具備支持快速圖像處理架構的DSP更是如此。可編程性使開發商在整個DSC 產品線中使用相同的 DSP 平臺,從而通過軟件優化不同產品的成像管道 (image pipe)。
新的壓縮標準
DSC傳統依賴于 JPEG 壓縮標準,其設計用于存儲靜止圖像,并且已通過互聯網而廣為流行。在壓縮中,JPEG 采用離散余弦變換 (DCT) 與量化技術有效地從包含 8x8 象素陣列的小編碼單元 (MCU) 的數據描述中消除大部分空間冗余。然后此算法采用熵或可變長度編碼 (VLC) 技術進一步減少存儲與傳輸的圖像數據。圖像解壓的步驟則與此相反。根據圖像內容,盡管壓縮比隨圖像的不同而不同,但是JPEG算法一般情況下可以將象素數據壓縮一個數量級而不丟失視覺完整性。
用于動畫與視頻的各種 MPEG 標準采用與 JPEG 相同的幀內技術入手來壓縮基本的靜止圖像或I幀,然后采用附加的幀間技術以消除隨后幀中的暫時冗余。幀間技術事實上涉及將每個連續幀的 16x16 象素宏塊壓縮到上一個幀的宏塊,然后采用運動估計與補償技術來描述宏塊的幀到幀移動。這些預測幀或P幀只需要描述其從上一幀的改變。然后以應用所決定的間隔定期對 I幀進行編碼。
圖1說明了一般 MPEG 視頻壓縮中所涉及的步驟。圖像頂部從輸入到輸出的幀內壓縮步驟(DCT、量化與VLC)足以生成 I幀。為了創建 P幀,剛編碼的幀必須在本地幀緩沖器中被解碼并存儲,以便實現過去幀的逐塊壓縮到未來幀(即運動估計),從而實現幀間壓縮。視頻解碼涉及圖下部的步驟(逆量子化、反向 DCT、運動補償)。除了圖中所示之外,MPEG 標準還具有采用獨立流程的音頻壓縮-解壓算法。
圖1:MPEG 視頻壓縮流程圖
MPEG-4:多媒體標準
MPEG 標準在不斷發展,以適應新興的視頻應用。初的 MPEG-1 標準開發用于大容量存儲與系統檢索,例如:交互式 CD-ROM 以及 VCD。此后,在 MPEG-2中對該標準進行了修改,以支持更高的分辨率、更廣泛的格式以及與 HDTV 相關的數字編碼。由于在 DVD 中的應用,MPEG-2 更受青睞。在視頻數據庫的要求所驅動下,MPEG-7 標準規定了用于信息搜索的內容表述。
MPEG-4 開發用于交互式多媒體應用,其中包括那些通過無線連接提供的多媒體應用。它與基本 H.263 視頻壓縮標準共享算法。與早期的 MPEG 標準相比,MPEG-4 為更高密度的圖像提供了更好的壓縮,并為更強大可靠的傳輸提供了更高的容錯彈性 (error resilience)。另外,MPEG-4 支持在幀中引入對象類型,從而可以獨立規定、壓縮、傳輸和重新組合不同的圖像及圖形單元。但是,該標準的對象支持功能仍有待開發切實可行的實施方案。到那時,包括 DSC 在內的大部分 MPEG-4 應用可以繼續基于通常情況下與圖像的完整矩形幀對應的單個對象。
高壓縮效率
特定剪輯的壓縮比隨主題的不同而千差萬別,不過一般情況下 MPEG 壓縮技術可以將 JPEG 幀的后續形式-運動 JPEG (M-JPEG) 的壓縮比在相同分辨率下提高一個數量級。進一步的壓縮源自幀間技術的采用。視頻幀一般大約為 10萬象素(352 x 288 象素,CIF 分辨率)或大約 2.5 萬象素(176 x 144象素,QCIF 分辨率),而不是一般情況下與 JPEG 相關的 2~5 兆象素。盡管分辨率的這種降低在高質量照片中是不能接受的,但是對于許多消費類 DSC 產品來說卻足夠了,尤其是考慮到它實現了寫真視頻的采集。