淺析MP4與MPEG-2 AAC技術(shù)(圖)

作者：時(shí)間：2008-08-11 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

　　摘要：介紹了MP4的由來及新特點(diǎn)；并介紹了MP4基于的核心音頻壓縮技術(shù)MPEG-2 AAC（Advanced Audio Coding）技術(shù)；最后對(duì)MP4和MPEG-2 AAC技術(shù)的應(yīng)用推廣前景進(jìn)行了簡單總結(jié)。

　　引言---音樂的魅力是永恒的，沉醉于優(yōu)美的旋律中，徜徉在流行的大潮里，音樂帶給人們太多的享受和夢(mèng)想。數(shù)字時(shí)代，數(shù)字音樂早已悄然滲入我們的生活，從最早出現(xiàn)的CD唱機(jī)到現(xiàn)今流行的MP3 隨身聽和網(wǎng)絡(luò)音樂等，都是數(shù)字音樂逐漸演變出來的各種形式和內(nèi)容。MP3問世不久，就憑著較高的壓縮比和較好的音質(zhì)創(chuàng)造了一個(gè)全新的音樂體驗(yàn)，就在MP3 日益成為一種主流的音樂格式之際，忽然間冒出個(gè)MP4。令很多人不得其詳。MP4究竟是什么？它與MP3之間有什么關(guān)系？它的出現(xiàn)對(duì)MP3有什么影響？ MP3或者M(jìn)P4的未來將會(huì)怎樣？下面將針對(duì)以上問題展開敘述。

MP4的由來
　　---與早已眾所周知的 MP3相比，人們對(duì)MP4的了解還不多。盡管從邏輯上來說，當(dāng)我們聽到或看到MP4時(shí)，會(huì)推斷這是MP3的后繼格式，事實(shí)卻要復(fù)雜得多。實(shí)際上，MP4與 MP3有著太多的不同。MP3是一種音頻壓縮的國際標(biāo)準(zhǔn)，而MP4卻是一個(gè)商標(biāo)的名稱。雖然兩者都屬于網(wǎng)絡(luò)音樂格式的范疇，但也代表著完全不同的兩種音頻壓縮技術(shù)和格式。

　　---MP4的出現(xiàn)，使原來就容易混淆的MPEG標(biāo)準(zhǔn)系列變得更加難以分辨了。MP3并不是指MPEG-3標(biāo)準(zhǔn)，而是MPEG Layer 3的簡稱，這是個(gè)ISO/IEC國際標(biāo)準(zhǔn)，是一種完全公開的音頻壓縮技術(shù)。而MP4既不是MPEG Layer 4的簡稱，更不是MPEG-4標(biāo)準(zhǔn)。它是GMO公司針對(duì)MP3侵犯音樂出版物的版權(quán)，采用了ATT授權(quán)的基于MPEG-2 AAC(Advanced Audio Coding)的A2B音樂，并將其命名為MP4，其用意大概是想表明MP4是繼MP3之后的一種升級(jí)換代技術(shù)，這正好符合人們的思維習(xí)慣。

　　---A2B 技術(shù)主要由以下三個(gè)部分組成。第一，ATT的音頻壓縮技術(shù)專利，以“知覺編碼”為關(guān)鍵技術(shù)可以將AAC壓縮比提高到 20:1而不損失音質(zhì)；第二，安全數(shù)據(jù)庫，它可以為你的A2B音樂文件創(chuàng)建一個(gè)特定的密鑰，并將此密鑰置于其數(shù)據(jù)庫中，只有A2B的播放器才能播放含有這種密鑰的音樂；第三，協(xié)議認(rèn)證，這個(gè)認(rèn)證包含了復(fù)制許可、允許復(fù)制副本數(shù)量、歌曲總時(shí)間、歌曲可以播放時(shí)間以及經(jīng)營銷售許可等信息。

　　---相對(duì)MP3等以往的音樂格式，MP4具有如下特點(diǎn)：

　　---(1)每首MP4樂曲就是一個(gè)擴(kuò)展名為exe的可執(zhí)行文件，其內(nèi)嵌播放器，操作簡便，在Windows里直接雙擊就可以運(yùn)行播放，十分方便；

　　---(2)由于采用先進(jìn)的A2B音頻壓縮技術(shù)，使MP4文件的大小僅為MP3的四分之三左右，更好的音質(zhì)，更大的壓縮比，從這個(gè)角度來看MP4更適合在Internet上傳播，而且音質(zhì)也更勝一籌；

　　---(3)獨(dú)特的數(shù)字水印，MP4采用了名為“SOLANA”的數(shù)字水印技術(shù)，可方便的追蹤和發(fā)現(xiàn)盜版行為，而且，任何針對(duì)MP4的非法解壓行為都可能導(dǎo)致MP4原文件的損毀；

　　---(4)支持版權(quán)保護(hù)，MP4樂曲內(nèi)置了包括與作品版權(quán)持有者相關(guān)的文字、圖像等版權(quán)說明，既可說明版權(quán)，又表示了對(duì)作曲家和演唱(奏)者的尊重；

　　---(5)較為完善的功能，MP4可獨(dú)立調(diào)節(jié)左右聲道的音量大小、內(nèi)置的波形/分頻動(dòng)態(tài)音頻顯示和音樂管理器可支持多種彩色圖像、網(wǎng)站鏈接及無限制的滾動(dòng)顯示文本?！　?/P>

　　---由此可知，MP4是一種商品，它是利用改進(jìn)后的MPEG-2 AAC技術(shù)對(duì)音頻進(jìn)行壓縮處理，并加上由出版公司直接授權(quán)的知識(shí)產(chǎn)權(quán)協(xié)議后形成一個(gè)全新形式的數(shù)字音樂標(biāo)準(zhǔn)。

MPEG-2 AAC

　　---MPEG-2 AAC（Advanced Audio Coding）是在1997年由以Bosi、Brandenburg、Johnston等為首的音頻編碼研究提出的，它總結(jié)了MPEG-1、MPEG-2 和AC-3等的長處，在MPEG 系統(tǒng)上進(jìn)一步改進(jìn)了很多新的功能，大大增強(qiáng)了編碼的靈活度，在保證音質(zhì)的同時(shí)更大限度地壓縮了碼率。同時(shí)，MPEG-2 AAC已經(jīng)成為MPEG-4標(biāo)準(zhǔn)中高質(zhì)量音頻編碼的核心，是下一代音頻壓縮標(biāo)準(zhǔn)。

　　---為了能夠適應(yīng)于不同的應(yīng)用場合，在AAC標(biāo)準(zhǔn)中定義了三種不同復(fù)雜度的框架(Profile)。分別為：

　　---Main Profile（主框架）：在這種框架具有最高的復(fù)雜度，可以用于存儲(chǔ)量和計(jì)算能力都很充足的場合。在這種框架中，利用了除增益控制以外的所有編碼工具來提高壓縮效率。

　　---Low Complexity Profile（低復(fù)雜度框架）：這種框架用于要求在有限的存儲(chǔ)空間和計(jì)算能力的條件下進(jìn)行壓縮的場合。在這種框架中，沒有預(yù)測和增益控制這兩種工具，TNS的階數(shù)比較低。

　　---SSR (Scalable Sample Rate) Profile（采樣率可分級(jí)框架）：在這種框架中，使用增益控制　　工具，但是預(yù)測和耦合工具是不被允許的，具有較低的帶寬和TNS階數(shù)。對(duì)于最低的一個(gè) PQF子帶不使用增益控制工具。當(dāng)帶寬降低時(shí)，SSR框架的復(fù)雜度也可降低，特別適應(yīng)于網(wǎng)絡(luò)帶寬變化的場合。

MPEG-2 AAC編解碼

　　---編碼時(shí)，時(shí)域信號(hào)先經(jīng)增益控制模塊(只在可分級(jí)檔次使用)，把信號(hào)分成4個(gè)頻帶，對(duì)信號(hào)的幅度進(jìn)行增益控制，在由濾波器組分解成為1024條頻域譜線。同時(shí)根據(jù)輸入的時(shí)域信號(hào)進(jìn)行心理聲學(xué)模型分析，計(jì)算當(dāng)前的掩蔽域值。另外，心理聲學(xué)模型還輸出M/S立體聲和強(qiáng)度立體聲處理所需的控制信息。TNS模塊對(duì)濾波器輸出的部分譜線進(jìn)行線性預(yù)測以殘差信號(hào)代替原譜線，強(qiáng)度立體聲模塊提取信號(hào)高頻成分的包絡(luò)。M/S立體聲模塊以和信號(hào)M和差信號(hào)S代替左右聲道信號(hào)。量化模塊進(jìn)行比特分配，盡量使量化噪聲小于掩蔽域值。量化后的信號(hào)與比例因子進(jìn)行哈夫曼編碼，最后進(jìn)行AAC組碼。把上述過程逆過來就是解碼。具體過程見圖1 所示的框圖。

　　---MPEG-2 AAC把高分辨率的濾波器組、預(yù)測技術(shù)、噪聲整形技術(shù)、聯(lián)合立體聲編碼、非均勻量化和哈夫曼編碼結(jié)合在一起，可以滿足如下的要求：
---（1）支持8kHz～96kHz的采樣頻率；
---（2）支持輸入通道配置為1/0(單聲道)、2/0(雙聲道立體聲)和3/2+1(左/中/右、左環(huán)繞/右環(huán)繞、低頻增強(qiáng)通道)等的不同的多通道配置；
---（3）在比特流語法中為更大數(shù)目和更小數(shù)目的通道配置留有余地；
---（4）在384Kb/s的數(shù)據(jù)率和3/2通道配置中，可以獲得“不可分辨的”音質(zhì)；
---（5）為了改善誤碼的消除，支持在存在誤碼的情況下維持碼流同步的機(jī)制和某種誤碼消除機(jī)制。

總結(jié)
　　---MP3是目前最流行的一種音樂格式，已經(jīng)占據(jù)了大量的網(wǎng)絡(luò)資源，深受廣大音樂愛好者的喜愛。因此，GMO MP4的推廣將會(huì)遇到很大的困難。但是，MP4有其獨(dú)特的優(yōu)越性，其壓縮技術(shù)優(yōu)于MP3，音質(zhì)好于MP3；從維護(hù)版權(quán)的角度看，會(huì)得到出版界的歡迎。尤其是和A2B 壓縮技術(shù)相同的AAC 格式、編/ 解碼器、音樂已經(jīng)在網(wǎng)絡(luò)上出現(xiàn)，正在被大眾接受并獲得發(fā)展。而且MPEG-2 AAC已經(jīng)成為MPEG-4標(biāo)準(zhǔn)中高質(zhì)量音頻編碼的核心，是下一代音頻壓縮標(biāo)準(zhǔn)。因此，隨著時(shí)間的推移和MPEG-4標(biāo)準(zhǔn)的推廣，作為MPEG-4音頻之一的MPEG-2AAC必將受到重視而廣泛應(yīng)用。

新聞中心

淺析MP4與MPEG-2 AAC技術(shù)(圖)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)