婷婷激情丁香六月开心五月,最新欧美精品一区二区三区,最新国产精品精品视频 视频,亚洲国产成人爱av网站,中文字幕av无码一区二区三区电影

首頁>> 解決方案>>新聞詳情

VoIP語音質(zhì)量測量方法

2007-06-08 00:00  《4PS呼叫中心國際標準研究中心》  咨詢電話:17317241681(微信同號)  51callcenter


  1、引言    

  近年來,隨著IP網(wǎng)絡技術的廣泛應用,關于IP網(wǎng)絡所能提供的業(yè)務的服務質(zhì)量問題受到研究者們越來越多的關注,如何來對服務質(zhì)量進行科學可靠的測量與評價是網(wǎng)絡測量與網(wǎng)絡規(guī)劃設計中相當關鍵的問題。VoIP作為下一代基于分組傳輸?shù)膮R聚業(yè)務網(wǎng)絡的先驅(qū),其語音質(zhì)量的測量將為未來網(wǎng)絡的服務質(zhì)量測量提供參考與經(jīng)驗。  
  
  2、VoIP語音特性對網(wǎng)絡性能的要求    

  語音在IP網(wǎng)絡上的傳送,不同于傳統(tǒng)PSTN語音傳輸,它是采用語音編碼方式,將模擬話音數(shù)字化并打包后采用盡力投送的IP包傳送機制,通過IP網(wǎng)絡傳送到接收端,接收端收集數(shù)據(jù)包后語音解碼得到模擬話音。此外VoIP也與傳統(tǒng)的網(wǎng)絡應用有許多的不同,例如,像FTP文件傳輸方式盡可能地占用網(wǎng)絡帶寬去快速地傳送文件;而ERP應用程序則發(fā)送較少的數(shù)據(jù),但是卻在發(fā)送者和接收者之間頻繁地交互數(shù)據(jù)流。相反,VoIP只占用很少的網(wǎng)絡帶寬,但是它不能容忍網(wǎng)絡的延時和變化。即使VoIP業(yè)務和傳統(tǒng)數(shù)據(jù)業(yè)務在同一網(wǎng)絡中實現(xiàn),語音流和數(shù)據(jù)流也不能被同一方式處理,因為:    
 ?。?)它們有不同的數(shù)據(jù)包大小    
  (2)它們按照不同速率發(fā)送數(shù)據(jù)包    
 ?。?)它們以不同的方式緩存和傳送數(shù)據(jù)包到目的地    
 ?。?)它們必須滿足不同的用戶期望    

  目前,大部分網(wǎng)絡并沒有準備好為端到端的VoIP實施提供像PSTN一樣的語音質(zhì)量和可靠性?,F(xiàn)存的VoIP網(wǎng)絡主要實現(xiàn)了IP中繼,提供兩個遠距離的PSTN的廉價長途連接。以下的兩個主要VoIP的語音特性反映對網(wǎng)絡性能的具體需求:    

  第一,VoIP利用RTP實時傳輸協(xié)議傳送數(shù)據(jù)。RTP是一個基于無連接UDP的應用協(xié)議,UDP是無連接的,它不會對數(shù)據(jù)包的傳送提供應答和跟蹤,這樣RTP也不會重新傳送網(wǎng)絡的丟包,這就要求網(wǎng)絡傳輸中應盡可能減少數(shù)據(jù)包的丟失;此外,按照TCP的應用協(xié)議,RTP也沒有直接的碰撞控制,以致于因為發(fā)送者發(fā)送太多太快的數(shù)據(jù)包,接收者將被淹沒。為了克服這個問題,RTP應用程序總是以固定速率發(fā)送數(shù)據(jù)包,這就要求網(wǎng)絡能夠盡量以固定的速率傳輸數(shù)據(jù)包。  
  
  第二,交互式會話不能容忍過大的延時。一個典型的電話會話依賴于發(fā)起者和接聽者之間的大量的交互,交互得越多,在會談中所能承受的延時則越小。這就要求數(shù)據(jù)包通過網(wǎng)絡的延時盡可能的小。    

  由此可見語音在IP網(wǎng)絡上的傳輸需要考慮許多不同于傳統(tǒng)電話網(wǎng)絡和傳統(tǒng)數(shù)據(jù)網(wǎng)絡的因素,所有這些特性因素都將制約到VoIP的語音質(zhì)量。 
   
  3、VoIP的語音質(zhì)量評價標準    
 
  怎樣評判VoIP的語音質(zhì)量是好或是壞?當然希望VoIP語音質(zhì)量與PSTN的一樣好,這也稱為Toll 級別,它是非常好的,但是事實并不一定是這樣的。在實施VoIP以前或以后,必須知道網(wǎng)絡能夠有怎樣的語音質(zhì)量,因此我們需要一些語音質(zhì)量的測量標準。從發(fā)明電話開始,語音質(zhì)量的測量方式是主觀的,人們摘起一個電話,然后由人耳來感知語音的好壞,這個方法是被廣泛認同的。在完善之后,這個主觀的語音質(zhì)量測量方法就是現(xiàn)在的平均主觀值MOS方法,定義在ITU-T P.800中?;谠撝饔^評測,人類接聽和感知語音質(zhì)量的行為被調(diào)研和量化,接聽何種級別質(zhì)量的語音,得到多少平均主觀值MOS,人類將起主要的反映作用。這個語音質(zhì)量和平均主觀值的對應關系為網(wǎng)絡的配置、基準和監(jiān)視提供了標準依據(jù)。 
   
  一個平均主觀值MOS是4或更高,被認為是比較好的語音質(zhì)量,而若平均主觀值MOS低于3.6,則大部分接聽者不能滿意這個語音質(zhì)量。雖然平均主觀測試準確有效,但是,這個主觀方法存在的最大問題就是,在現(xiàn)實中,讓一組人接聽語音和評價語音的質(zhì)量實現(xiàn)起來是非常困難和昂貴的,因此人們在不斷的探索能進行客觀測量的方法。  
  
  現(xiàn)在許多客觀的測量方法已經(jīng)出現(xiàn)并被應用,諸如,PSQM /PSQM+感知通話質(zhì)量測量[2],PESQ感知評估通話質(zhì)量測量[3],PAMS(英國電信)感知分析測量等。PSQM和PAMS測量方法都需要發(fā)送一個語音參考信號通過電話網(wǎng)絡,在網(wǎng)絡的另一端采用數(shù)字信號處理的方式比較樣本信號和接收到的信號,進而估算出網(wǎng)絡的語音質(zhì)量。PESQ結(jié)合了PSQM和PAMS的優(yōu)勢,針對VoIP和混合的端到端應用作了改進,并針對MOS和MOS-LQ計算方法做了修改。最開始這些方法被用于測量編碼算法,后來也逐漸應用到VoIP網(wǎng)絡系統(tǒng)的測量中,著名的測量儀器生產(chǎn)廠商Agilent的語音質(zhì)量測量儀器VQT即是代表。此外,有必要指出,平均主觀值MOS是廣泛認同的語音質(zhì)量標準,因此,無論采用何種方法所有測量方法都必須對應它們的結(jié)果對應到最終的平均主觀值MOS,以上各種方法均可以最終以MOS值表示。    

  4、E-model測量方法的提出   
 
  以上介紹的測量方法在實驗室能夠很好地應用于分析個別設備的問題,例如,利用PSQM和PESQ分析話機的質(zhì)量。但是這些測量方法不適用于在數(shù)據(jù)網(wǎng)絡上分析語音質(zhì)量,是基于傳統(tǒng)的電話網(wǎng)絡。它們的缺點主要是,測量不是基于數(shù)據(jù)網(wǎng)絡的,不能反映諸如延時、抖動和丟包等數(shù)據(jù)網(wǎng)絡特有的問題,沒有考慮網(wǎng)絡故障對用戶感覺造成的影響,單純的從收發(fā)信號差異的角度分析網(wǎng)絡語音問題。為了克服這些缺點,國際電聯(lián)的G.107標準提出了E-model,它關注數(shù)據(jù)全面的網(wǎng)絡損傷因素,很好地適應在數(shù)據(jù)網(wǎng)絡中語音質(zhì)量的評估。 
   
  E-model的前提是假設語音質(zhì)量損傷因素總是物理附加的,簡單說來就是,如果諸如噪聲、回音、延時、編碼器性能、抖動等網(wǎng)絡損傷因素能夠被靈活的加入,那么網(wǎng)絡的一個全面客觀的質(zhì)量等級或稱為“呼叫者體驗”的因素就能夠被估計。 
   
  4.1 E-model的基本算法公式及其與MOS值的對應  
  
  E-model用來作為算法最終結(jié)果的是R值,被稱為全面的網(wǎng)絡傳輸?shù)燃壱?,取值范圍?到100。R值的計算從沒有網(wǎng)絡和設備的損傷影響開始,此時語音質(zhì)量是最好的,R=Ro。Ro是無網(wǎng)絡延時和設備損傷因素的基本信號與收發(fā)噪聲以及電流、背景噪聲之比,即基本信噪比。但是因為網(wǎng)絡和設備損傷因素的存在,減少了通過網(wǎng)絡的語音質(zhì)量,R值的基本計算公式如下:  
  
  R=Ro- Is-Id-Ie+A    
  其中,Is:與語音信號傳輸同步的損傷    
  Id:語音信號傳輸延時后的損傷    
  Ie:由設備引入的損傷,例如編碼器損傷    
  A:優(yōu)勢因素,致力于考慮呼叫者的期望因素,在大部分情況下,一般設置為0。   
 
  由公式可知,全面的語音質(zhì)量(R值)的計算是通過首先估計一個連接的信噪比(Ro),然后從中減去網(wǎng)絡損傷(Is,Id,Ie),最后再用呼叫者對語音質(zhì)量的期望(A)進行補償后得到。實際應用中,基本公式中的輸入Ro、Is、Id和Ie,每一個都需要考慮各種各樣的實際網(wǎng)絡損傷因素,通過非常復雜的數(shù)學計算而得到。  
  
  前面已經(jīng)講過,任何的測量方法,最終都將對應為MOS值標準,E-model也一樣。下面的曲線圖清楚的表示出了R值和平均主觀值MOS之間的映射關系。X軸表示E模型的R值,Y軸表示平均主觀值MOS。    

  加入用戶的感知特性(以用戶滿意程度表示),進行語音質(zhì)量等級劃分,對應R值和MOS值的范圍如下表所示。由于網(wǎng)絡數(shù)據(jù)與實際語音之間存在轉(zhuǎn)化過程,這樣固有的損耗使得R值最大只能到93.2,也就是平均主觀值MOS只有4.4。G.107的R值默認最大為94。  
  
  4.2 語音編碼方式、延時、抖動和丟包對R值的影響  
  
  網(wǎng)絡損傷的主要因素包括語音編碼、回聲、平均包延時,抖動和包丟失率?;芈暜a(chǎn)生于IP網(wǎng)絡與傳統(tǒng)PSTN相連處,在單一VoIP網(wǎng)絡內(nèi)部暫不討論。在一個僅由編碼、延時、抖動和丟包造成系統(tǒng)失真的情況下,R的計算公式可以簡化如下:  
  
  R = Ro-Icodec-Idelay-Ipdv-Ipacketloss 
   
  下面將討論這四個主要損傷因素對R值的影響。 
   
  在語音處理中,編碼是以硬件或軟件的方式去采樣語音和決定數(shù)據(jù)包的速率。ITU標準定義了差不多十幾種編碼方式,每一種都有不同的特點。低速的編碼方式占用更少的帶寬,但是因為使用有損的壓縮算法,低速編碼更加削弱了語音質(zhì)量。在實際情況中,選擇低速的編碼方式能夠在相同的連接上建立更多的呼叫,但是引入了更大的延時,使語音質(zhì)量對丟包也更加敏感。因此選擇越低速率的編碼方式,將明顯地減少E模型的R值,當然這也不是完全絕對的。下表顯示了一些常用的編碼方式對應的Ie值和固有R值[4]。   

  延時是指話音從發(fā)起者到接收者所經(jīng)過的時間[5],一般而言,端到端的延時由以下四部分組成:   
 
 ?。?)傳播延時:指話音從一端到另一端通過網(wǎng)絡的時間,由信號通過傳播媒介的速度和傳播的距離決定 

 ?。?)傳送延時:指通過網(wǎng)絡路徑上的所有網(wǎng)絡設備的時間    
  (3)包轉(zhuǎn)化延時:指的是編碼器進行數(shù)模轉(zhuǎn)化的時間    
 ?。?)抖動緩沖延時:指的是在接收端用來保持一個或多個接收的數(shù)據(jù)包的時間,用來克服數(shù)據(jù)包到達時間的變化,也就是克服抖動產(chǎn)生的延時    

  延時會引起語音會話過程的空白,帶來語音的變形和會話的中斷,也就是說,延時的增大導致了R值的減小。延時的時長在100~200ms之間開始被收聽者所察覺,使得會話不自然。建議的延時上限為150ms,若延時達到200ms則開始有嚴重的會話中斷。    

  抖動,也叫做延時的變化,是指在一個VoIP呼叫過程中所有發(fā)送的數(shù)據(jù)包到達的時間差異。當一個數(shù)據(jù)包發(fā)送時,發(fā)送端在RTP報文頭上增加一個時間戳;當在另一端被接收時,接收端同樣增加另一個時間戳;計算這兩個時間戳可以得到這個數(shù)據(jù)包的通路時間。如果在一個呼叫中包含不同的通路時間,則存在抖動。在視頻應用程序中,抖動表現(xiàn)為圖像閃動,而在電話呼叫中,它表現(xiàn)的效果與丟包產(chǎn)生的效果相似,某些字詞聽不清楚或錯誤。抖動的大小取決于數(shù)據(jù)包的通路時間的差異程度,差異程度越大,則抖動也越大。如果抖動值大于50ms,則平均主觀值MOS值劇烈地降低,認為是極差的語音質(zhì)量。通過增加抖動緩沖的數(shù)量,可以有效地降低抖動的影響,但是增加了一毫秒的抖動緩沖,則相應增加了一毫秒的網(wǎng)絡延時。 
   
  丟包是一個影響語音質(zhì)量的關鍵因素。數(shù)據(jù)包發(fā)送端和接收端之間的數(shù)據(jù)包數(shù)目的差值即為網(wǎng)絡傳輸丟失包數(shù)目。VoIP使用RTP實時傳輸協(xié)議傳輸語音數(shù)據(jù)包,雖然可以利用RTP報文頭的序列號檢查數(shù)據(jù)包的丟失和亂序,但是它并沒有重傳機制。任何丟包和亂序都將影響語音的質(zhì)量。網(wǎng)絡主要有兩種類型的丟包情況,一種是或多或少的隨機丟包,當網(wǎng)絡保持沖突碰撞時,就會偶爾有一個或兩個數(shù)據(jù)包發(fā)生丟失;另一種是爆裂丟包,是指連續(xù)一個以上的數(shù)據(jù)包丟失,會顯著地影響語音質(zhì)量,明顯減小R值。當少量的丟包是隨機地分布時,人耳并不容易感覺到較差的語音質(zhì)量。 
   
  E-model測量方法正是將這些網(wǎng)絡的損傷因素充分予以考慮,以此作為對網(wǎng)絡語音質(zhì)量的全面?zhèn)鬏斣u估,真正意義上的研究了數(shù)據(jù)包化的語音呼叫的質(zhì)量問題。 
   
  5、運用E-model對實時的VoIP網(wǎng)絡進行語音質(zhì)量測量  
  
  一種E-model在實時網(wǎng)絡測量中的應用[6],就是測量幾個有限的E 模型參數(shù),同時估計其它非測量參數(shù),從而運算出反映網(wǎng)絡全面?zhèn)鬏斮|(zhì)量的R值。一種客觀的語音質(zhì)量測量輸出了MOS值,將該MOS值轉(zhuǎn)換為Ie參數(shù),與此同時根據(jù)網(wǎng)絡信息查找E模型參數(shù)參考表得到非測量參數(shù)的值,最后將所有的參數(shù)進行運算,得到最終的反映全面質(zhì)量的R值。    

  除此之外,有的測量儀器廠商設計的基于E-model的評估工具,能夠在數(shù)據(jù)網(wǎng)絡的軟件代理之間產(chǎn)生RTP數(shù)據(jù)流去模擬VoIP語音呼叫,每次這個模擬VoIP語音呼叫運行時,網(wǎng)絡延時,抖動和丟包將作為測量結(jié)果而被記錄,這個測量通過E-model計算公式得到一維的結(jié)果R值,然后再對應到平均主觀值MOS。此時,并沒有真實的語音信號通過數(shù)據(jù)網(wǎng)絡,與以前的諸如VQT一類的測量儀器使用真實語音信號通過數(shù)據(jù)網(wǎng)絡的測量方法是完全不同的。    
  
  當前企業(yè)網(wǎng)通信已成為驅(qū)動VoIP發(fā)展的重要力量,因此我們在分析企業(yè)網(wǎng)發(fā)展時需要重新審視VoIP技術的各個不同發(fā)展階段。VoIP是第一個規(guī)模應用的分組業(yè)務網(wǎng),可分為三個發(fā)展階段。
  第一階段:1996年到1999年。這一階段VoIP的主要特點為:

  在企業(yè)網(wǎng)、互聯(lián)網(wǎng)上小規(guī)模地提供不保證服務質(zhì)量的語音通信;信令控制協(xié)議主要是H.323v1/v2,MGCP;單GK、單MGCP的小業(yè)務系統(tǒng);不與電信網(wǎng)互通,或通過企業(yè)小網(wǎng)關作為用戶接入電信網(wǎng);不具有電信運營的OSS;不具有商業(yè)運營模式。

  第二階段:1999年到現(xiàn)在。這一階段的主要特點為:

  組建大規(guī)模商用的VoIP長途業(yè)務網(wǎng),為公眾提供有服務質(zhì)量保證的長途語音通信;業(yè)務網(wǎng)技術體系主要為H.323v4+H.248,個別小運營商用MGCP或SIP;多組GK多管理域組網(wǎng)解決了業(yè)務大網(wǎng)組網(wǎng)問題;特別建設的承載網(wǎng)(承載VPN)解決了VoIP長途語音業(yè)務網(wǎng)的QoS問題;較完善的OSS提供了對長途語音基本業(yè)務和部分增值業(yè)務的支持;具有電信運營模式;與傳統(tǒng)電信網(wǎng)實現(xiàn)網(wǎng)間互聯(lián)互通;作為基本電信業(yè)務之一受政府主管部門監(jiān)管。

  第三階段:從現(xiàn)在開始是VoIP發(fā)展的第三階段,目標是向NGN演進。其主要特征為:

  把網(wǎng)關向末端延伸,IP到末端提供有服務質(zhì)量保證的通信業(yè)務;向公眾提供更豐富的語音增值業(yè)務;從單一媒體通信向多媒體通信發(fā)展;融合固定通信業(yè)務與移動通信業(yè)務;融合電信業(yè)務和互聯(lián)網(wǎng)業(yè)務;解決組建NGN大網(wǎng)問題,解決網(wǎng)間互聯(lián)互通互操作問題;解決NGN網(wǎng)內(nèi)媒體信號處理問題;新的業(yè)務網(wǎng)絡具有強大的OSS;可監(jiān)管,可合法監(jiān)聽;具有良好的商業(yè)運營模式。

網(wǎng)絡世界

 

共0條評論網(wǎng)友評論
  • 全部評論
共0條記錄(共頁)
向您推薦

新聞 按行業(yè)分類

廠商 按產(chǎn)品分類


        
總機:021-51601170 直線:021-58307717,17317241681(微信同號) 電子郵件:cct@51callcenter.com  瀘ICP備10026114號-4  行業(yè)交流俱樂部QQ:2919157212
地址:上海市浦東新區(qū)牡丹路60號東辰大廈810室  郵編:201204 上海趨天網(wǎng)絡技術服務有限公司 版權(quán)所有(2002-2018)