在剛剛結束的騰訊技術開放日-騰訊云小微AI語音專場,來自騰訊智能平臺產品部AI語音專家?guī)黻P于語音識別、自然語言理解、智能對話機器人等行業(yè)應用探索等領域的精彩分享,從騰訊云小微AI語音助手的角度,揭開AI語音助手在技術和應用領域的探索和最新成果。
為此騰訊云小微AI語音助手在接收信號后,通過聲學前端處理,對豐富的聲音信息進行甄別,分流至本地語音識別、云語音識別以及云+端協調機制進行精準識別,提供更為精準的技術解決方案。
以常見的環(huán)境噪聲處理為例,當用戶聲音信號發(fā)出,在路噪、風噪、空調、音響等不同噪聲類型的干擾下,很容易讓車載語音識別發(fā)生理解偏差。騰訊云小微AI語音助手從車內語音交互場景出發(fā),通過騰訊自有技術和硬件設備完成回聲消除、噪聲抑制以及定位和拾音,確保得到干凈的語音信號,同時在聲學模型層面從訓練數據、特征提取、網絡結構等方面進行針對性優(yōu)化以提升識別系統(tǒng)對噪聲的魯棒性。
在直播中,我們還看到了騰訊云小微AI語音助手在不同用戶口音輸入語音情況下如何做出精準反饋。騰訊云小微AI語音助手的魯棒性源自容錯性極小的兩套處理方案,一是基于遷移學習的分地域模型方案,二是引入地域向量的單模型方案。在這樣的智能車載語音識別系統(tǒng)下,騰訊云小微AI語音助手聯合騰訊車聯TAI已合作多家國內頭部車企和熱銷車型,通過騰訊云小微車載語音識別系統(tǒng)的助力,無懼用戶口音,精準識別語音指令,滿足車內交互場景的語音需求。
根據騰訊技術開放日-騰訊云小微專場直播所演示,騰訊云小微AI語音助手以高質量低延時語音合成、智能語音交互系統(tǒng),進化成為真正以用戶需求為導向的個性化服務。
物聯網時代,語義理解成為語音交互的核心所在。通過聲學前端處理,降低干擾信號、抑制回聲,提升語音識別效果、語音喚醒效果,隨即將文字轉換為命令字,通過語料模型匹配,做領域分發(fā)。在這個過程中騰訊云小微AI語音助手支持自然語音識別,語義理解、語音指令隨意說,系統(tǒng)均可很好的理解并執(zhí)行,同時將文本轉化為語言流,在終端設備上進行語音播報。
高質量低延時語音合成則為我們展示了智能語音系統(tǒng)的深度學習能力。基于“互聯網+”自然語言理解發(fā)展成自然的人-機器交互方式是指基于自然語言理解技術重塑人與機器之間的交互方式,使自然語言成為人-機器之間進行交互的自然接口。通過騰訊云小微AI語音助手的語音合成能力,支持純中文、純英文以及中英混搭的合成場景,提供50+種不同男女聲音色,個性化音色定制能力,王者榮耀妲己、李白定制語音包;采用業(yè)內領先的算法,優(yōu)化不同場景中的語音音色,讓AI語音助手發(fā)聲更為自然。
在騰訊云小微AI語音專場我們了解到,騰訊云小微技能開放平臺是唯一支持小程序接入的AI行業(yè)解決方案,目前已經開放與京東和大眾點評的合作,用戶語音指令即可操作在京東和大眾點評的購物和服務,幫助小程序實現更智能化的用戶體驗。
在客服配置上,騰訊云小微AI語音助手將文本模式分類拆分為知識庫檢索、服務售前、服務售后等模式,檢索為功能性檢索,售前、售后可根據問題回答策略轉向人工模式。其中分層模塊的搭建上注重知識庫的基礎搭建,模塊分工明確,流程簡單。
當然,客服機器人還需要加強訓練,挖掘算法、索引堆砌并不能解決問題,更多需要明確的系統(tǒng)規(guī)則和流程。想要發(fā)現問題、解決問題,重要的是實現人工、機器人的交互,在線客服、模型算法、統(tǒng)計監(jiān)控、配置平臺,缺一不可。例如從人工服務界面引用客服機器人的索引,進而給出服務明確的答案。只有快速迭代優(yōu)化的深度學習,才能適應數字化時代的商業(yè)發(fā)展需求。
在自然語言處理技術方面,我們主要分享了騰訊云小微的兩項前沿技術,1)在2019法研杯閱讀理解賽道中獲得冠軍采用的方案;2)一篇關于信息抽取的發(fā)表在人工智能國際會議IJCAI-2020上的最新論文。通過直播,我們看到了騰訊云小微在知識抽取與問答領域的技術積累,并以豐富的案例形象生動的展示了相關技術在實際應用中的作用。
不僅如此,我們還能從騰訊云小微AI語音助手強大的開放能力中發(fā)現更多領域的應用探索,比如為企業(yè)定制品牌IP形象。這在以往不敢想象,在5G、直播風口,虛擬人以安全、可控、高效成為眾多企業(yè)熱衷的對象,而通過騰訊云小微語音助手提供智能語音交互,根據不同硬件終端和應用場景,可以觸發(fā)豐富的表情動作,快速換形象。因為騰訊云小微AI語音助手的全雙工交互功能,高度智能化免喚醒、主動引導對話,再加上騰訊系正版IP授權服務,AI語音助手的商業(yè)變現價值擁有廣闊的市場機會。
51CallCenter網友
2020-07-27 15:44:13
智慧客服魔方系統(tǒng)可根據業(yè)務定制化質檢規(guī)則需求,全渠道語音文本質檢,魔方數據一鍵質檢,支持語音轉譯文本、語速檢測、靜默檢測等,覆蓋100%服務記錄,降低企業(yè)人力成本以及提升服務水平