音視頻編碼是什么

2017 05 27 BOAC


音視頻編碼概念

所謂視頻編碼就是通過特定的壓縮技術,將某個視頻格式的文件轉換成另外一種視頻格式文件的方法。

視頻編碼的主要功能是完成圖像的壓縮,使數字電視信號的傳輸量由1Gbit/s(針對1920x1080顯示格式)減少為20-30Mbit/s。

自然界中的聲音以及波形都非常復雜,聲音其實也是一種能量波,它有頻率和振幅;其中頻率所對應的是時間軸線,振幅對應的是電平軸線。波是無限光滑的,弦線可看成由無數點組成。

音頻編碼主要是完成對聲音信息的壓縮。聲音信號數字化后,信息量比模擬傳輸狀態大很多,不能像模擬電視聲音那樣直接傳輸;因而需要對聲音多一道壓縮編碼工序,即為音頻編碼。

音視頻編碼原理

視頻編碼主要是對圖像進行有效的壓縮。原始視頻圖像數據中包含大量的冗余信息視頻編碼主要采取塊運動估計和運動補償技術有效的去除圖像幀間冗余度,來壓縮碼率和帶寬,實現信號有效傳輸的目的。

我們需要通過抽樣、量化、編碼三個步驟將連續變化的模擬信號轉換為數字信號。抽樣就是在時間上將模擬信號離散化。量化是用有限個幅度值近似原來連續變化的幅度值,把模擬信號的連續幅度變為有限數量的有一定間隔的離散值。編碼就是按一定的規律把量化后的值用二進制數字表示,然后轉換成二值或多值得數字信號流。

通常我們采用PCM編碼,其主要過程是將話音、圖像等模擬信號每隔一段時間進行取樣,使其離散化,同時將抽樣值按分層單位四舍五入取整量化,并將抽樣值按一組二進制碼來表示抽樣脈沖的幅值。