1、語音編解碼算法
語音編解碼算法是決定公網對講平台所能提供的語音質量的根本因素。
EVRC編碼廣泛使用於CDMA網絡。 EVRC標準遵循規範TIA
IS-127的內容。 EVRC編碼基於RCELP(鬆弛碼激勵線性預測)標準。該編碼可以以Rate 1(171bits/packet),Rate1/2(80bits/packet)或是Rate1/8(16bits/packet)的容量進行操作。在要求下,它也能產生空包(0bits/packet)。
但是受限於2G/3G網絡帶寬,公網對講平台很多采用EVRC
8K採樣變速率編解碼來壓縮傳輸的語音數據。但是EVRC半速率(4Kbps)編碼其音質較差,MOS分只有3.0分左右。
AMR語音編碼是GSM2+和WCDMA的默認編碼標準,是第三代無線通訊系統的語音編碼標準。 GSM-AMR標準基於ACELP(代數激勵線性預測)編碼。它能在廣泛的傳輸條件下提供高品質的語音效果。
2、語音增強算法
主要包括環境噪聲抑制、自適應聲學迴聲消除、自動增益控制、自適應均衡等算法。
在通信過程中語音受到來自周圍環境、傳輸媒介引入的噪聲,使接收到的語音信號並非純淨的原始語音信號,而是受噪聲污染的帶噪語音信號。這裡的“噪音”定義為所需語音信號以外的所有乾擾信號。
干擾信號可以是窄帶的或寬帶的、白噪聲的或有色噪聲的、聲學的或電學的、加性的或乘性的,甚至可以是其它無關的語音。由噪聲導致的語音質量的下降會使許多語音處理系統的性能急劇惡化。採用語音增強技術進行預處理,可有效地改善系統性能。
3、傳輸策略
傳輸延時、抖動、丟包在無線網絡環境下是都會,常用的策略有抗抖動處理,丟包隱藏等,但需要在語音延時/抖動與音質之間取得平衡。
在語音抖動處理中主要採用的是抖動緩衝技術, 即在接收方設定一個緩衝池, 話音包到達時首先進入緩衝池暫存, 系統以穩定平緩的速率將話音包從緩衝池中取出、解壓、然後播放給受話者。這種緩衝技術可以在一定限度內有效處理話音抖動, 提高音質。
使用抖動緩衝技術的原理,需要處理好延時與抖動的平衡,取兩者的平衡點,使緩存器的網絡延時保持在一定時間左右。
4、服務器處理機制
服務器信令傳輸機制優化,優化並發處理等。我們知道4G網絡帶寬大,傳輸時延小,所以針對平台架構,要想提升語音質量可以通過如下措施:
調整編解碼算法
提升採樣率,傳統使用的8K採樣,可以使用16K或更高。使用現代改良編解碼算法,例如3GPP AMR, ITU G.72x語音編碼簇等。
https://www.409shop.com.hk/shop.php
沒有留言:
發佈留言