摘要:通信專業(yè)設(shè)備環(huán)境考試培訓(xùn)頻壓縮編碼:雖然表示圖像需要大攝的數(shù)據(jù),但圖像數(shù)據(jù)是髙度相關(guān)的。一幅圖像內(nèi)部以及視頻序列中相鄰圖像之間有大量的冗余信息。對(duì)于一幅二維圖像.可以注意到圖像中的許多部分的灰度或顏色差別并不是太大,某些區(qū)域是均勻著色或高度相關(guān)的。
1.視頻壓縮編碼
(1)視頻信息的冗余
雖然表示圖像需要大攝的數(shù)據(jù),但圖像數(shù)據(jù)是髙度相關(guān)的。一幅圖像內(nèi)部以及視頻序列中相鄰圖像之間有大量的冗余信息。對(duì)于一幅二維圖像.可以注意到圖像中的許多部分的灰度或顏色差別并不是太大,某些區(qū)域是均勻著色或高度相關(guān)的。例如,圖像的背眾可能是一堵墻,它是均勻上色或顯示出規(guī)則的模式,稱為空間相關(guān)或空間冗余。對(duì)干沒有場景切換或鏡頭快速推拉搖移的視頻序列,畫面中的背景一般并無變化,只有移動(dòng)的物體產(chǎn)生畫面的差異.因而各幀圖像間的差別極小,即視頻序列中的圖像是高度相關(guān)的,稱為時(shí)間相關(guān)或時(shí)間冗余。靜止圖像壓縮的一個(gè)目標(biāo)是在保持重建圖像的質(zhì)量可以被接受的同時(shí),盡量去除空間冗余信息。對(duì)于活動(dòng)視頻壓縮,在去掉空間冗余的同時(shí)去除時(shí)間冗余,可以達(dá)到較高的壓縮比。
除空間冗余和時(shí)間冗余外,在一般的圖像數(shù)據(jù)中,還存在著其他各種冗余信息,主要表現(xiàn)為以下幾種形式。
①信息熵冗余
信息熵冗余也稱為編碼冗余。由信息論的有關(guān)原理可知,為表示圖像數(shù)據(jù)的一個(gè)像素點(diǎn),只要按其信息熵的大小分配相應(yīng)比特?cái)?shù)即可。然而對(duì)于實(shí)際圖像數(shù)據(jù)的每個(gè)像素,很難得到它的信息熵,因此在數(shù)字化一幅圖像時(shí),對(duì)每個(gè)像素用相同的比特?cái)?shù)表不,這樣必然存在冗余。
②結(jié)構(gòu)冗余
在有些圖像的部分區(qū)域內(nèi)存在著非常強(qiáng)的紋理結(jié)構(gòu),或是圖像的各個(gè)部分之間存在有某種關(guān)系,如自相似性等,這些都是結(jié)構(gòu)冗余的表現(xiàn)。
③知識(shí)冗余
在有些圖像中包含的信息與某些先驗(yàn)的基礎(chǔ)知識(shí)有關(guān),例如,在-般的人臉圖像中,頭、眼、鼻和嘴的相互位置等信息就是一般常識(shí),這種冗余稱為知識(shí)冗余。
④視覺冗余
在多數(shù)情況下,重建圖像的最終接收者是人的眼睛,為了達(dá)到較高的壓縮比,可以利用人類視覺系統(tǒng)的特點(diǎn)得到高壓縮比。人類的視覺系統(tǒng)對(duì)于圖像的注意是非均勻和非線性的.特別是人類的視覺系統(tǒng)并不是對(duì)于圖像中的任何變化都能感知。例如,圖像系數(shù)的量化誤差引起的圖像變化在一定范圍內(nèi)是不能為人眼所察覺的。
(2)壓縮編碼
①預(yù)測編碼
預(yù)測編碼可以在一幅圖像內(nèi)進(jìn)行(幀內(nèi)預(yù)測編碼),也可以在多幅圖像之間進(jìn)行(幀間預(yù)測編碼)。預(yù)測編碼基于圖像數(shù)據(jù)的空間和時(shí)間冗余特性,用相鄰的已知像素(或圖像塊)來預(yù)測當(dāng)前像素(或圖像塊)的取值,然后再對(duì)預(yù)測誤差進(jìn)行量化和編碼。這些相鄰像素(或圖像塊)可以是同行掃描的,也可以是前幾行或前幾幀的,相應(yīng)的預(yù)測編碼分別稱為一維、二維和三維預(yù)測。其中一維和二維預(yù)測是幀內(nèi)預(yù)測,三維預(yù)測是幀間預(yù)測。
幀內(nèi)預(yù)測編碼一般采用像素預(yù)測形式的DPCM。其優(yōu)點(diǎn)是算法簡單,易于硬件實(shí)現(xiàn);缺點(diǎn)是對(duì)信道噪聲及誤碼很敏感,會(huì)產(chǎn)生誤碼擴(kuò)散,使圖像質(zhì)量大大下降。同時(shí),幀內(nèi)DPCM的編碼壓縮比很低,因此現(xiàn)在已很少獨(dú)立使用,一般要結(jié)合別的編碼方法。幀間預(yù)測編碼主要利用活動(dòng)圖像序列相鄰幀間的相關(guān)性,即圖像數(shù)據(jù)的時(shí)間冗余來達(dá)到壓縮的目的,它可以獲得比幀內(nèi)預(yù)測編碼高得多的壓縮比。幀間預(yù)測編碼作為消除圖像序列幀間相關(guān)性的主要手段之一,在視頻圖像編碼方法中占有很重要的地位。幀間預(yù)測編碼一般是針對(duì)圖像塊的預(yù)測編碼,它采用的技術(shù)有幀重復(fù)法、閾值法、幀內(nèi)插法、運(yùn)動(dòng)補(bǔ)償法和自適應(yīng)交替幀內(nèi)/幀間編碼法等,其中運(yùn)動(dòng)補(bǔ)償預(yù)測編碼現(xiàn)已被各種視頻圖像編碼標(biāo)準(zhǔn)采用,得到了很好的結(jié)果。這類圖像編碼方法的主要缺點(diǎn)在于對(duì)圖像序列不同的區(qū)域,預(yù)測性能不一樣,特別是在快運(yùn)動(dòng)區(qū),預(yù)測效率較差。
預(yù)測編碼的關(guān)鍵在于預(yù)測算法的選取,這與圖像信號(hào)的概率分布很有關(guān)系,實(shí)際中常根據(jù)大傲的統(tǒng)計(jì)結(jié)果,采用簡化的概率分布形式來設(shè)計(jì)最佳的預(yù)測器,有時(shí)還使用自適應(yīng)預(yù)測器以較好地刻畫圖像信號(hào)的局部特性,提高預(yù)測效率。
②變換編碼
與預(yù)測編碼技術(shù)相比,消除圖像數(shù)據(jù)空間相關(guān)性的一種更有效的方法是進(jìn)行信號(hào)變換。變換編碼通常是將空間域相關(guān)的像素點(diǎn)通過正交變換映射到另一個(gè)頻域上,使變換后的系數(shù)之間的相關(guān)性降低。在變換后的頻域上應(yīng)滿足:所有的系數(shù)相互獨(dú)立;能量集中于少數(shù)幾個(gè)系數(shù)上;這些系數(shù)集中于一個(gè)最小的區(qū)域內(nèi)。盡管圖像變換本身并不帶來數(shù)據(jù)壓縮,但由于變換后系數(shù)之間相關(guān)性明顯降低,圖像的大部分能量只集中到少數(shù)幾個(gè)變換系數(shù)上。采用適當(dāng)?shù)臋M化和熵編碼可以有效地壓縮圖像的數(shù)據(jù)量。而且圖像經(jīng)某些變換后.系數(shù)的空間分布和頻率特性有可能與人眼的視覺特性匹配,因此可以利用人類視覺系統(tǒng)的生理和心理特點(diǎn)來得到較好的編碼系統(tǒng)。
K-L變換是在以上思路下構(gòu)造出來的最佳線性變換方案。它是用數(shù)據(jù)本身的相關(guān)矩陣對(duì)角化后構(gòu)成的。這種變換將產(chǎn)生完全不相關(guān)的變換系數(shù)。K-L變換雖然是均方誤差準(zhǔn)則下的最佳變換,但在實(shí)際編碼工作中,人們更常采用離散余弦(DCT:Discrete Cosine Transform)變換。對(duì)大多數(shù)圖像信源來說,DCT變換是在現(xiàn)行變換編碼方法中,最接近K-L變換的方法。
對(duì)變換后圖像系數(shù)的編碼一般采用門限編碼加區(qū)域編碼的形式。以DCT變換為例,根據(jù)變換系數(shù)的能雖分布,可以將圖像劃分為不同的區(qū)域,其中變換后幅值較大的圍像系數(shù)大多集中于圖像塊的左上角。與其他系數(shù)相比,這些低頻系數(shù)具有的能量最大,包括了圖像的大部分內(nèi)容,在變換圖像中的地位最重要,應(yīng)使它們的量化誤差最小。同樣,對(duì)于圖像塊的其他區(qū)域,也應(yīng)采用與該K域相配的景化和編碼形式。這種按能量分布對(duì)不同區(qū)域采用不同量化編碼的技術(shù)就稱為區(qū)域編碼。另一方面,變換圖像中有許多系數(shù)的幅度很小,只具有原圖像中很小比例的能量,對(duì)圖像質(zhì)量影響甚微,因此一般采用設(shè)定閾值的方法,置小于閾值的變換系數(shù)為零,從而大大提髙編碼效率。經(jīng)門限和區(qū)域編碼后,變換圖像的大部分系數(shù)為零,如何采用有效的方法將非零系數(shù)和零系數(shù)組織起來,在帶來最少冗余的同時(shí)保證最大的連零系數(shù)出現(xiàn)概率,是變換圖像編碼中的又一關(guān)鍵問題。在DCT圖像編碼方法中,對(duì)變換系數(shù)進(jìn)行Zig-Zag排序非常巧妙地解決了這一問題,但對(duì)有些圖像變換方法,這種技術(shù)并非最佳方案。
在一般圖像中,對(duì)應(yīng)邊緣輪廓的位置附近含有大量高頻信息,它們相對(duì)干原圖像是非常局部的,代表了圖像數(shù)據(jù)的精細(xì)結(jié)構(gòu)。按人眼的視覺特性,這些邊緣輪廓信息對(duì)于圖像的主觀質(zhì)量很重要,在編碼時(shí)應(yīng)給予特別考慮。然而由于傳統(tǒng)的正交變換時(shí)頻局域性很差,變換后的系數(shù)失去了對(duì)原圖像精細(xì)結(jié)構(gòu)的描述,從變換圖像得不到圖像邊緣輪廓等局部信息,W此在量化編碼時(shí)無法采用特殊的方法。而且在傳統(tǒng)的變換圖像編碼方法中,大多是靠丟棄高頻系數(shù)來提髙壓縮比的,從而導(dǎo)致圖像的邊緣輪廓模糊,嚴(yán)重影響復(fù)原圖像的主觀質(zhì)量,這是傳統(tǒng)變換編碼方法的缺點(diǎn)之一。傳統(tǒng)變換編碼方法的另.缺點(diǎn)是提高編碼壓縮比時(shí)會(huì)出現(xiàn)塊效應(yīng)。這是因?yàn)闉榻档妥儞Q算法的運(yùn)算復(fù)雜度和提髙編碼效率,傳統(tǒng)圖像變換均采用了分塊變換技術(shù)。圖像塊大,相關(guān)性就高,壓縮比也就大。但是塊的尺寸太大又會(huì)丟失數(shù)據(jù)的平穩(wěn)性,從而引人誤差,包括失去高頻細(xì)節(jié)、引人沿物體邊界的噪聲和可見的DCT圖塊邊界。實(shí)驗(yàn)證明,塊大小為16X16或8X8是較好的選擇。
要實(shí)現(xiàn)一個(gè)實(shí)用的變換編碼系統(tǒng),需要四個(gè)步驟第一步是選擇變換類型,CT變換是得到最廣泛應(yīng)用的一種類型;第二步是選擇方塊的大小,較好的方塊尺寸是8X8或16X16;第三步是選擇變換系數(shù),并對(duì)其進(jìn)行高效的量化,以便傳輸或存儲(chǔ);第四步是對(duì)量化系數(shù)進(jìn)行比特分配,通常使用Huffman編碼或游程編碼。
③具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測編碼
在圖像傳輸技術(shù)中,活動(dòng)圖像(特別是電視圖像)是被關(guān)注的主要對(duì)象。活動(dòng)圖像是由時(shí)間上以幀周期為間隔的連續(xù)圖像幀組成的時(shí)間圖像序列,它在時(shí)間上比在空間上具有更大的相關(guān)性。消除活動(dòng)序列圖像在時(shí)間上的冗余度是圖像壓縮編碼的一個(gè)重要途徑。與消除圖像中相鄰像素間的空間冗余度一樣,消除序列圖像在時(shí)間上的相關(guān)性也可采用預(yù)測編碼的方法,即不直接傳送當(dāng)前幀的像素值,而是傳送當(dāng)前幀的像素值和其前一幀或后一幀的對(duì)應(yīng)像素X之間的差值,這稱為幀間預(yù)測。當(dāng)圖像中存在著運(yùn)動(dòng)物體時(shí),簡單的預(yù)測不能收到好的效果。例如,在圖2.3中,當(dāng)前幀與前一幀的背景完全一樣,只是小球平移了一個(gè)位S,如果簡單地以A-1幀像素值作為A幀的預(yù)測值,則在實(shí)線和虛線所示的圓內(nèi)的預(yù)測誤差都不為零。如果巳經(jīng)知道了小球運(yùn)動(dòng)的方向和速度,可以從小球在A-1幀的位置推算出它在A幀中的位置,而背景圖像(不考慮被遮擋的部分)仍以前一幀的背景代替,將這種考慮了小球位移的A-1幀圖像作為A幀的預(yù)測值,就比簡單的預(yù)測準(zhǔn)確得多,從而可以達(dá)到更高的數(shù)據(jù)壓縮比。這種預(yù)測方法稱為具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測。
具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測編碼是視頻壓縮的關(guān)鍵技術(shù)之一,它包括以下兒個(gè)步驟:首先,將圖像分解成相對(duì)靜止的背景和若干運(yùn)動(dòng)的物體,各個(gè)物體可能有不同的位移,但構(gòu)成每個(gè)物體的所有像素的位移相同,通過運(yùn)動(dòng)估值得到每個(gè)物體的位移矢量;然后,利用位移矢量計(jì)算經(jīng)運(yùn)動(dòng)補(bǔ)償后的預(yù)測值;最后對(duì)預(yù)測誤差進(jìn)行量化、編碼、傳輸,同時(shí)將位移矢量和圖像分解方式等信息送到接收端。
④具有運(yùn)動(dòng)補(bǔ)償?shù)膸g內(nèi)插編碼
在具有運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測編碼系統(tǒng)中,利用了活動(dòng)圖像幀間信息的相關(guān)性,通過對(duì)相鄰頓圖像的預(yù)測誤差進(jìn)行編碼而達(dá)到壓縮數(shù)據(jù)的0的。運(yùn)動(dòng)補(bǔ)償技術(shù)的引人,大大提高了預(yù)測楮度,使傳輸每一幀圖像的平均數(shù)據(jù)。量進(jìn)一步降低。在此系統(tǒng)中,圖像的傳輸幀率并沒有變化,仍與編碼前的幀率一樣。然而在某些應(yīng)用場合,如可視電話、會(huì)議電視等,對(duì)圖像傳輸幀率的要求可適.當(dāng)降低,這就為另外一種活動(dòng)圖像壓縮編碼方法一一幀間內(nèi)插——提供了可能?;顒?dòng)圖像的幀間內(nèi)插編碼是在系統(tǒng)發(fā)送端每隔一段時(shí)間丟棄一幀或幾幀圖像,而在接收端再利用圖像的幀間相關(guān)性將丟棄的幀通過內(nèi)插恢復(fù)出來,以防止幀率下降引起閃爍和動(dòng)作的不連續(xù)。
在幀間預(yù)測中引人運(yùn)動(dòng)補(bǔ)償?shù)哪康氖菫榱藴p少預(yù)測誤差,從而提高編碼效率。運(yùn)動(dòng)估值的不準(zhǔn)確會(huì)使預(yù)測誤差加大,從而使傳輸?shù)臄?shù)據(jù)率上升,但接收端據(jù)此位移矢最和預(yù)測誤差解碼不會(huì)引起圖像質(zhì)量下降;而在幀間內(nèi)插中引人運(yùn)動(dòng)補(bǔ)償?shù)哪康?,是使恢?fù)的內(nèi)插幀中的運(yùn)動(dòng)物體不致因?yàn)閮?nèi)插而引起太大的圖像質(zhì)量F降。這是由于在丟棄幀內(nèi)沒有傳送任何信息,要確定運(yùn)動(dòng)物體在丟棄幀中的位置必須知道該物體的運(yùn)動(dòng)速度。運(yùn)動(dòng)估值的不準(zhǔn)確,將導(dǎo)致內(nèi)插出來的丟棄幀圖像失真。另外,在幀間內(nèi)插中的位移估值一般要對(duì)運(yùn)動(dòng)區(qū)的每一個(gè)像素進(jìn)行,而不是對(duì)一個(gè)子塊;否則,內(nèi)插同樣會(huì)引起運(yùn)動(dòng)物體邊界的模糊。因此.在幀間內(nèi)插中較多使用能夠給出單個(gè)像素位移矢懂的像素遞歸法。
除了上述介紹的幾種目前應(yīng)用最為廣泛的壓縮編碼方法外,矢貴暈化編碼、子帶編碼、小波變換、分層編碼、分形編碼、模型編碼等均是近年來研究十分活躍的編碼方法。
返回目錄:
相關(guān)匯總推薦:
通信專業(yè)實(shí)務(wù)互聯(lián)網(wǎng)技術(shù)數(shù)據(jù)通信基礎(chǔ)教程
通信專業(yè)實(shí)務(wù)考試設(shè)備與環(huán)境教程匯總
通信工程師備考資料免費(fèi)領(lǐng)取
去領(lǐng)取
共收錄117.93萬道題
已有25.02萬小伙伴參與做題