語音合成即TTS技術(shù),又稱文語轉(zhuǎn)換技術(shù),能將任意文本信息實時轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音朗讀。它涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、計算機(jī)科學(xué)等多個學(xué)科,是中文信息處理領(lǐng)域的一項前沿技術(shù),解決的主要問題就是如何將文字信息轉(zhuǎn)化為可聽的聲音信息,即讓機(jī)器像人一樣開口說話。
作為TTS的發(fā)展是隨著語音技術(shù)的成熟和應(yīng)用的發(fā)展,近年來語音技術(shù)應(yīng)用逐漸滲透到CTI領(lǐng)域,為呼叫中心業(yè)務(wù)注入了新的活力。
信息的爆炸性增長和市場對多樣化、實時信息需求的發(fā)展,使得采用傳統(tǒng)錄音回放技術(shù)的呼叫中心系統(tǒng)和電話聲訊服務(wù)已無法滿足人們對信息獲取的要求,日益成熟的語音技術(shù)以其自然、平易、親切等特點(diǎn)成為信息獲取和溝通的較佳方式,也是構(gòu)建多媒體與網(wǎng)絡(luò)呼叫中心的必需技術(shù)。
目前,在CTI應(yīng)用領(lǐng)域,語音技術(shù)的應(yīng)用需求更加迫切,這里的語音應(yīng)用不僅對語音合成的質(zhì)量有較高要求,同時更注重大規(guī)模的實時應(yīng)用。TTS技術(shù)使呼叫中心在各行各業(yè)中的應(yīng)用更好。
IVR系統(tǒng)是呼叫中心的重要功能,通過IVR系統(tǒng),用戶可以利用音頻按鍵輸入信息,從系統(tǒng)中聽取預(yù)先錄制的數(shù)字或合成的語音信息。具有TTS功能的IVR可以加快服務(wù)速度,節(jié)約服務(wù)成本。
在呼叫中心系統(tǒng)中的IVR可以通過調(diào)用TTS ,將檢索出來的文本信息轉(zhuǎn)化為語音數(shù)據(jù),播報給用戶,實現(xiàn)自助式的信息服務(wù)。
而在坐席系統(tǒng)中我們還可以運(yùn)用TTS功能將座席的查詢結(jié)果轉(zhuǎn)化成語音信息播放給用戶聽,座席代表無需將這些內(nèi)容口述給用戶,從而大大減少人工座席的平均處理時長。
提高人工坐席資源的利用率。對于時效性要求很高的公共信息,如股評、新聞等,可以采用TTS系統(tǒng)以離線合成的方式將這些信息在最短的時間內(nèi)轉(zhuǎn)化成為語音文件保存在呼叫中心系統(tǒng)的語音文件服務(wù)器上。這樣用戶只需撥打電話就可以聽到最新的信息。
呼叫中心TTS與錄音回放相比具備哪些優(yōu)勢?
在語音合成技術(shù)應(yīng)用之前,錄音回放一直是呼叫中心自動語音服務(wù)中所采用的主要手段,但是隨著多媒體信息需求的增大,語音服務(wù)系統(tǒng)中近年來應(yīng)用TSS技術(shù)得到了迅速發(fā)展。
(1) 就工作量而言,錄音需要大量的人力,在信息量以幾何級數(shù)增長的今天,錄音往往無法滿足信息的供給,而語音合成將絕大多數(shù)工作由機(jī)器代替,人們只需提供現(xiàn)成的文本信息即可輸出聲音信息。
(2) 對于動態(tài)的信息,尤其是對實時性要求很高的信息,如股票行情等,如果讓錄音員錄音則至少在半小時后才能對外提供,而語音合成可以實現(xiàn)實時的轉(zhuǎn)換,每分鐘可刷新一次。
(3) 由于信息的高速增長,錄音數(shù)據(jù)存放和查詢也存在問題。將信息以文本形式存儲在計算機(jī)中可節(jié)約大量系統(tǒng)資源再結(jié)合計算機(jī)技術(shù)對數(shù)據(jù)庫中的信息進(jìn)行搜索和整理將輸出的結(jié)果用語音合成轉(zhuǎn)換成聲音,這樣就可以解決信息服務(wù)中海量信息的存儲和查詢的問題。
(4) 錄音的信息維護(hù)、修改的工作量比較大。而文本信息的維護(hù)和修改相對要容易得多,通過語音合成技術(shù)只需對文本信息進(jìn)行修改就可以完成信息內(nèi)容的更改和維護(hù)工作。
目前TTS技術(shù)已經(jīng)十分成熟,現(xiàn)在的研究主要集中在生成的漢語語音的清晰度和自然度上,而且通過一些參數(shù)做到語氣語調(diào)的調(diào)整,使得語音更接近真人播音。