《2015年度(第八屆)中國聯(lián)絡中心與BPO產(chǎn)業(yè)大會》ACCC大會于2015年5月14-15日在上海國際會議中心隆重舉行。峰會由呼叫中心與BPO行業(yè)資訊網(wǎng)(51Callcenter)主辦,中國呼叫中心與BPO產(chǎn)業(yè)聯(lián)盟(CNCBA)、4PS聯(lián)絡中心國際標準組織指導,有來自于金融、電商、通信、物流、IT、制造業(yè)、跨國企業(yè)等行業(yè)管理層、及聯(lián)絡中心、客戶服務、云計算、服務外包、CRM、社會化媒體、企業(yè)通信等行業(yè)4200位管理者參加了該活動。
4PS標準/CNCBA主席/國家工信部全國服務外包技能考試指導委員會副理事長顏曉濱、及來自全國各地的行業(yè)協(xié)會及行業(yè)高管、專家做了幾十場精彩紛呈的演講和分享。
科大訊飛網(wǎng)絡語音業(yè)務咨詢總監(jiān)馬家鄰做了主題為“話時代”的智能客服的演講。
科大訊飛網(wǎng)絡語音業(yè)務咨詢總監(jiān) 馬家鄰
馬家領科大訊飛:今天我演講的主題是“話時代”的智能客服-從“能聽會說”到“能理解會思考”。中國呼叫中心市場保持快速增長,總坐席數(shù)超過120萬,預計未來三年平均年增長率超過15%。像剛才顏主席說的哪怕一個做堅果第二的公司的呼叫中心都已經(jīng)達到了300人的規(guī)模。
我們的呼叫中心接入終端智能化,服務多渠道,服務營銷一體化發(fā)展趨勢明顯,智能自助服務需求迫切。我們可以看到,人工占比非常重,人力成本越來越高。特別是呼叫中心,很多家的呼叫中心管理有一個問題就是招人難,招進來之后留人難。工作壓力大,有一些在這個里面值夜班,很辛苦。我們更希望把人工做的一些事情轉到我們的機器進行智能化的服務,這樣來節(jié)省我們的人工成本,降低我們的運營成本。作為企業(yè)和用戶溝通的重要橋梁,客戶服務體系在互聯(lián)網(wǎng)大潮中越來越重要,與此同時,如何提高服務質量的同時降低我們的人工服務成本,這是我們所迫切需要關注的。智能語言技術作為最自然最流暢的交流方式,致力于實現(xiàn)人機交流無障礙,人人溝通無障礙。從以機器為中心的人機交互轉為以人為中心的自然交互,科大訊飛在這里引領了自然交互的創(chuàng)新。2010年10月份發(fā)布全球首個移動互聯(lián)網(wǎng)智能語音交互平臺-訊飛語音云,2011年9月份“語音及語言信息處理國家工程實驗室”揭牌。2012年3月我們新一代語言云平臺發(fā)布首個實用中文語義理解系統(tǒng)。同年8月成立了中國語音產(chǎn)業(yè)聯(lián)盟,訊飛當選為理事長單位。2012年12月與中國移動聯(lián)合推出智能語音助手產(chǎn)品,這個產(chǎn)品的定位是給用戶提供一個實用的助手,比如閱讀、查天氣等便民引用,包括跟移動深層業(yè)務合作的應用。2013年11月份發(fā)布語音新品解決方案,比如與歌華有線的合作,總的用戶量超過了25萬,而且這25萬里面活躍用戶數(shù)超過了80%。2014年訊飛的語音輸入法激活用戶數(shù)也超過了1.6億,智能語音助手跟移動合作的產(chǎn)品,超過了1.7億,語音云總用戶超過了7億。接入應用數(shù)超過了6萬。
訊飛語音技術的進展是多種類的,在我們呼叫中心用哪些語音技術來提高我們的服務質量,并且降低我們的運營成本,這里面有一個語音合成的技術應用。這是一個國際合成大賽暴風雪杯的一個比賽情況,滿分是5分,這個是自然語音達到的是4.7左右,就是我們普通人普通話說的比較好的話達到4.7,我這個水平也就是4.3左右。訊飛系統(tǒng)在所有的參賽系統(tǒng),參賽的單位由美國的微軟、IBM以及其他一些全球頂尖的語言研究公司,訊飛是唯一一個在自然度上超過4.2,也就是講接近于甚至超過部分普通人自然發(fā)音的水平。這個比賽我們聯(lián)續(xù)參加了9年獲得了九連冠的好成績。我們致力于將語音技術應用在實際環(huán)境中,大家最近也聽到過高德導航,林志玲的聲音,包括郭德剛的聲音,包括用它來播小說。這就是我們一個合成的效果,聲音也聽的比較熟悉。我們根據(jù)它的發(fā)音制訂了一個音庫,輸入一段文本或是一個小說,用它的聲音讀出來,讓大家聽起來,特別一些場景下聽的更舒服。這是我們更高表現(xiàn)力的合成。
有一個應用落地是跟中國移動的一個“和閱讀”,用戶聽的時長從42分鐘提升到的87分鐘。在這個里面,國際有聲閱讀市場達到了7.5億的價值,預計2016年將達到22.6億。這也是我們語音合成的應用。語音合成是一個從文本到語音,反過來,語音到文本就是我們的語音識別。客服中心呼叫中心最不缺的就是語音,語音是我們最大的寶庫。語音識別也是訊飛在不斷的做迭代,而不是說做到國際領先就踏步不前。訊飛2010年首個達到實用的中文聽寫技術,2011年率先推出個性化語音識別。2012年業(yè)界首個DNN中文聽寫技術,2013年是首次在終端實現(xiàn)本地語音聽寫。2014年業(yè)界領先的高抗噪和方言語音的聽寫。我們在抗噪環(huán)境下做一個降噪,去混響濾波。比如我們訊飛合作的電視是集成在麥克風上的,現(xiàn)在我們想采用一種讓人更懶的方式-就是遠場識別,我就躺在沙發(fā)上說我要聽歌,要看中央一套,它是3到5米的背景噪音干擾性非常大,這是我們抗噪的應用??乖雽嶋H應用案例是2013年奔馳汽車在全球范圍內(nèi)選了三家做語音的頂級廠商做了一個PK,這個PK是在這么幾種場景下,一種是車速在0碼所有的窗戶全開接受外部的噪音,還有車速達到100碼或是140碼的情況下,我們知道,120到140碼,它的噪音在駕駛艙內(nèi)比較大,訊飛在這些場景下都可以保持識別率達到90%以上。這樣在我們實際應用過程中達到了實際應用的價值。我們訊飛跟奔馳簽訂了一個長期的合作,現(xiàn)在跟寶馬、大眾,國內(nèi)的奇瑞、江淮都在進行合作。
另外一個我們呼叫中心關注的問題就是方言,因為我們的客戶很大一部分絕大部分用戶都不說普通話,還有一部分是普通話不好。這里面我們就做了一個方言識別,種類像粵語、四川話、河南話、上海話,包括藏語、維語。這是我們的識別,識別之后,我們語音、聲紋的應用,公安部跟訊飛聯(lián)合成立了一個聯(lián)合實驗室,這也是公安部唯一一個不在北京的實驗室,已經(jīng)獲得了很多的成果。聲紋在民用方面我們也有一些深入應用。后面我會講到。
另外一個技術就是人臉識別,人臉識別是香港大學湯曉鷗教授牽頭做的一個,機器模擬跟人認知還是有差距的,而通過這個已經(jīng)超過了人的認知,識別率超過了99%。另外就是我們的語音翻譯,它的一個學術情況在日常的交流領域、旅游領域、中學教育領域等垂直領域有較深入的應用。忠誠度和流利度滿分是5分,如果是4分就是一個優(yōu)良的效果。這是在民語局跟我們合作的一個項目。IWSLT國籍口語機器翻譯大賽是04年發(fā)起的,我們14年第一次參加,第一次參加之后,在中譯英和英譯中比賽中就取得了第一名。語音和文本翻譯都有很好的成績。我們落地的一個項目也是在一些領域內(nèi),比如說已經(jīng)開始出國訪問的用戶做一些場景下,比如點餐、購物等等這些環(huán)境下采用我們語音翻譯進行交流。
我們的語音技術還能讓我們的智能客服更加的智能,主要有這么幾塊。一個是語音導航,這個主要是應用在我們呼叫中心的電話系統(tǒng)。傳統(tǒng)方式更多采用的方式是按鍵,0到9個數(shù)字所代表的業(yè)務和涵蓋的業(yè)務肯定不足以滿足我們的業(yè)務。訊飛語音導航,把所有的菜單扁平化,實現(xiàn)了用戶的自由說功能。一些客戶按鍵過程當中按著按著就煩了,甚至提示音都不聽,直接按個3直接到人工。人工成本很高,如果自助系統(tǒng)里面直接解決就可以降低我們的運營成本。第一個達到語音門戶,打個比方我查一個我的話費,用戶說的是很開放的一種表達方式,我們系統(tǒng)后臺會做一個交互,請問您查詢當前話費還是歷史話費,這樣用戶再確定一次我查詢當前話費。這個流程設計中是這樣的一個原則,就是交易數(shù)每個業(yè)務下面一層層往下深入,深入到不能深入的時候,比如5元流量包,語音導航當中打破了所有的層級菜單,可以達到任意一個節(jié)點,比如跳到另外一個業(yè)務下一步修改密碼,就可以直接跳過去,這樣你交互次數(shù),交互時間減少,客戶感知也非常好。我們的運營中心的成本也會降低。另外人工導航、緩解人工壓力,比如我打銀行的電話,高峰期經(jīng)常打不進去,怎么辦,我就只有等,有的時候等的時間比較長,在這個時候,如果給用戶一個另外一種選擇,可以嘗試進入到我們智能語音自助系統(tǒng)進行自助語音服務,有的客戶愿意嘗試,覺得還不錯,我很多的需求都能解決,下一次就不會再打人工而直接進入語音系統(tǒng)。另外我們開展的一項工作叫夜班完全代替人工,夜間可能很多人會值夜班,有一些點已經(jīng)取消了夜班只留一兩個人員,其他的全部交給我們語音導航完成。
還有一個多渠道的機器人,客戶現(xiàn)在特別是年輕客戶,微信、微博、QQ、短信、網(wǎng)站等等很多通道都能夠找到我們的服務,呼叫中心這里面有時候形成一個信息孤島,因為每個通道,我們的想法是好的,這幾個通道在各自積累知識庫的過程當中做到同步,但是實際運營當中非常難,因為它畢竟不是一個知識庫。在這種情況下,我們現(xiàn)在時間一長,可能說用戶在不同的渠道問同一個問題得到不同的答案,這是我們所不愿意看到的。如果你來的是文本我訊飛語音理解對你文本進行理解,如果你是語音我識別成文本再進行你的需求的識別。最終我們對接的就是我們所有的比如后端的系統(tǒng)來給客戶提供統(tǒng)一的答案,統(tǒng)一的知識庫,統(tǒng)一的接入,所有的渠道都是一個出口。不管你有多少入口我只有一個出口,這樣就保證我們的一致性,你這個數(shù)據(jù)庫我們只有一個情況下維護起來,包括后端再擴容的情況下,會更節(jié)省我們的人工節(jié)省我們的成本,多的知識庫維護總是需要很多的人工的。在不斷的完善過程當中,這些知識都可以共享,作為后臺的運營管理平臺,作為客戶的運營管理、統(tǒng)計報表,數(shù)據(jù)監(jiān)控報告,這是我們多渠道機器人。
下一個就是我們剛才兩個是面向與前端的,包括我們合成也好,導航也好,還是多渠道智能機器人都是面向客戶直接可以體現(xiàn)到的。在我們后臺還有一個分析管理系統(tǒng),這是專門跟我們內(nèi)部運營管理用的。語音分析,在我們呼叫中心里面最不缺的就是語音文件,語音文件日積月累,隨著時間的積累體積還是很大的,我們存儲空間有限,不得已而刪掉,有的會刻盤,有一個公司我看到他們刻了很多的盤,但是又不用。我們怎么分析呢,首先語音文件我們很難做直接的分析,這個過程當中我們要一個結構化的過程,把它的信息打亂掉,比如這個語音我們把它翻譯成文本,這個文本就是我們分析的結構化文件,每個關鍵詞在這個語音當中所處的位置也是一個信息,包括客戶的語速情況、情緒情況,使這種文件結構化處理之后,特別中間有一個場景分割的技術,通過這個場景分割,用戶和坐席,把他們的說話全部打散重新組合,客戶和坐席都不說話就是靜音也可以進行分析。針對坐席我們可以進行一個服務質量檢測,進行質檢,關鍵詞是不是有一些不合適的用語,或是中間服務是不是有一些策略進行一些質量檢測。針對客戶,客戶本身對我們用戶的評價,用戶這里面有沒有我們營銷的機會,或是用戶對我們的業(yè)務和產(chǎn)品反饋情況,以及我們關注的焦點是什么,對于用戶這部分通話里面,我們進行挖掘分析現(xiàn)在客服中心,呼叫中心都不愿意做成本中心,客服中心就是晴雨表,我們怎么樣面向市場的東西面向價值,大家都在思考這個問題,我們現(xiàn)在也在思考。通過我們訊飛語音分析,輔助我們呼叫中心做這樣的一步,傳統(tǒng)的模式我們看,可能是制定營銷政策、策略實施,營銷活動完成,統(tǒng)計數(shù)據(jù),然后往上面報了之后再制定設施。這就是我在自說自話,不知道客戶有什么樣的反饋。在語音分析里面,讓這種營銷成為一種可能,語音分析來說我們對客服錄音進行處理,處理之后,用戶關注的焦點知道之后,針對性的制定有效策略,策略實施過程當中時時關注客戶的興趣和反饋情況,來調整我們的策略。這樣的迭代,就是我一個營銷策略是跟客戶不停的互動,這個里面主要是及時根據(jù)用戶的情況來進行調整分析。這是我們語音分析打造營銷流程的應用。還有很多應用比如我們平時的各種模型的建設,流量的監(jiān)控、專題模型,現(xiàn)在的4G手機等等都可以做一些專題。
我們的聲紋識別在公安領域用的比較多,如果是呼叫中心或是民用里面,比如聲紋自由說、動態(tài)數(shù)字密碼、開放文本密碼或是固定的文本密碼。第一個聲紋自由說,我們通過IVR服務來進行聲紋碰撞識別出來古代文本密碼,比如白日依山盡就是以這個作為密碼。人臉識別的應用,比如這兩個圖,是同一個人嗎?當然還是可以看到很多的特征,這就是人臉識別應用、人臉識別檢測、面部關鍵點的檢測,人臉比對。這個里面剛才為什么把提到人聯(lián)合聲紋放在一起,因為我們做一些支付也好,銀行的一些業(yè)務,我們?nèi)四樅吐暭y可以雙引擎是不是更安全。用戶單獨對語音進行攻擊通過聲紋是有的,有時候對人臉進行攻擊的可能性也是有的,但是同時攻擊你的人臉和聲音的可能性就很小了,這兩種技術的融合是不是更能確定一下是不是你本人了。比如你用一張照片對著這個冒認的話,我們后臺有一個3D檢測技術,這個是不是3D的,還有人是用視頻的方式冒認,我們現(xiàn)在有一個技術叫活體檢測、唇音同步,我給你的密碼是動態(tài)的,你不知道我給你的密碼是什么,你說話的口形不一樣,我也可以知道是不是冒認的?,F(xiàn)在支付領域,包括客戶的認證領域有一個非常大的應用,特別是我們在后臺,比如呼叫中心用戶打電話來,輸入你的身分證號碼,輸入你的密碼,問一些信息,如果這個里面采用雙引擎讓客戶感知更好。這個里面我們提到的產(chǎn)品的應用和解決方案,在訊飛我們呼叫中心可以整合成一個能力平臺,這樣的能力平臺包含了合成、識別、理解和我們的生物識別。在上面避免了多個煙囪的現(xiàn)象,多個渠道應有在我們這個平臺上展示。
下面是我們的訊飛超腦計劃。簡單來說,就是讓系統(tǒng)像人一樣自動學習知識,我們的目標就是讓機器能夠在2018年考上一本考大學。這個項目是我們的副總裁,也是科大訊飛的研究院院長胡郁博士任首席專家,集結我國該領域70%以上的研究機構團隊,共三十多家單位,分九個子課題,共同進行這個方面的突破?,F(xiàn)階段我們做的預期的成果能夠聯(lián)想,自動學習,自然交互。這個里面如果把我們訊飛的超腦成果和智能客服結合在一起,我們會發(fā)展成什么樣呢?智能客服的入口將無處不在,將也會能聽能說,能理解會思考!謝謝大家!
如下為大會現(xiàn)場演講實錄,如需完整觀看所有內(nèi)容,請登錄--http://www.qianlongyuan.cn/2015/
本新聞為51Callcenter原創(chuàng)稿件,轉載請注明出自51Callcenter。謝謝!