《2014年度(第七屆)中國聯(lián)絡(luò)中心與BPO產(chǎn)業(yè)大會》ACCC大會于2014年4月17-18日在上海國際會議中心隆重舉行。峰會由呼叫中心與BPO行業(yè)資訊網(wǎng)(51Callcenter)主辦,中國呼叫中心與BPO產(chǎn)業(yè)聯(lián)盟(CNCBA)、4PS聯(lián)絡(luò)中心國際標(biāo)準(zhǔn)組織指導(dǎo),有來自于金融、通信、物流、電子商務(wù)、制造業(yè)、跨國企業(yè)等行業(yè)管理層,及聯(lián)絡(luò)中心、客戶服務(wù)、云計算、服務(wù)外包、CRM、社會化媒體、企業(yè)通信等行業(yè)眾多嘉賓參加了該活動。
4PS標(biāo)準(zhǔn)/CNCBA主席/國家工信部全國服務(wù)外包技能考試指導(dǎo)委員會副理事長顏曉濱、及來自臺灣等地的行業(yè)協(xié)會及行業(yè)高管、專家做了幾十場精彩紛呈的演講和分享。
云知聲產(chǎn)品總監(jiān)歐光欣做了主題為開啟語音交互新時代的演講。
如下為大會現(xiàn)場演講實錄,如需完整觀看所有內(nèi)容,請登錄--http://www.qianlongyuan.cn/2014/
歐光欣:各位朋友大家好,大家聽了一早上也非常不容易,我們云知聲是一個新成立的公司,在座的朋友之間可能知道云知聲的不多,今天我在這邊做一個簡單的介紹。我看到前面也有一點拖,我盡量保證規(guī)定的時間內(nèi)結(jié)束我的演講。
今天我給大家介紹的我們的云知聲,我們是專業(yè)做智能語音交互的廠商。我非常同意前面蕭總講的專業(yè)的人做專業(yè)的事情,我們是專門做語音識別語音交互的廠商,如果大家需求可以跟我聯(lián)系。我叫歐光欣。今天我給大家講的主要是包括三個方面,一個方面是我們云知聲公司的介紹,第二塊介紹一下在語音導(dǎo)航技術(shù)我們跟其他廠商的區(qū)別,最后我給大家介紹一下我們關(guān)于語音質(zhì)檢技術(shù)有哪些突破。
云知聲產(chǎn)品總監(jiān) 歐光欣
云知聲是一家成長很快的語音識別企業(yè),前面有一家語音識別企業(yè)的老大哥給大家做過介紹了,我們云知聲成立于2012年,現(xiàn)在大家可以在網(wǎng)上直接就可以在APP找到我們的語音識別法,我們也可以進(jìn)行多語言的識別,我們語音識別技術(shù)不斷的提升,從2012年我們的識別準(zhǔn)確率在85%左右到今年我們準(zhǔn)確率已經(jīng)超過了96%,當(dāng)然我們也支持普通話和帶方言口音的普通話,而且我們的抗噪技術(shù)也非常好。這是我們一個發(fā)展的歷程,我們雖然成立時間不長,但是做這一塊的同事的經(jīng)驗非常豐富,我們主要研發(fā)團隊以及市場銷售人員在語音行業(yè)中間大概都做了十年,超過十年以上的經(jīng)驗。所以雖然公司是新的,但是可能很多朋友都認(rèn)識很久了。公司成立不足500天就完成了A輪一個億的人民幣的融資,我們現(xiàn)在也是公司之間我們的語音云發(fā)展之后有300多合作伙伴。我們語音云使用量每天超過百萬次。
在整個我們云知聲的產(chǎn)品體系分三塊,我們叫立足云端,就是我們會通過語音交互的共有云,如果是互聯(lián)網(wǎng)運營商可以調(diào)動我們的共有云。如果企業(yè)當(dāng)中對你的數(shù)據(jù)的安全性要求非常高,就可以建設(shè)自己的私有云,我們私有云也是一套非常完整的方案提供給大家;如果你做語音評測,語音教學(xué)這一塊做英文或是做粵語甚至是普通話的語音的評測,我們有一個語音評測的云服務(wù)提供給大家。終端已經(jīng)和電視、穿戴、車載、智能手機廠商開展了非常好的合作。很多智能手機,比如小米就采用的我們語音解決方案。芯片方面我們業(yè)提供芯片的解決方案,我們能夠提供軟核和硬核的解決方案,因特爾廠商我們提供了軟核的解決方案,同時我們自己也可以提供芯片的硬核解決方案。這是我們語音的平臺,我們支持的客戶已經(jīng)超過了一億,穩(wěn)定運時間已經(jīng)達(dá)到了99.99%,我們語音識別占用量非常低,只需要2KB每秒。
我們是技術(shù)性為主的公司,所以我們新技術(shù)層出不窮,我們可以支持中、英、粵語多語言識別,同時還有一個非常有意思的技術(shù)叫說話人識別技術(shù)。坐席通話中間,每個坐席通話都做錄音,錄音之后我們客服和用戶語音混合在一起,我們可以通過說話人識別技術(shù),讓兩組語音分別開,對客服語音做質(zhì)檢,對用戶語音做大客戶的處理和挖掘。
下面有一個小的DEMO大家可以看一下。我們做的一個中、英粵語識別的情況。這是我們標(biāo)準(zhǔn)的普通話,然后我們也支持英文的輸入。我們可以完整的提供中英粵語的技術(shù)支持,大家可以看到,這是我手機APP上的一個錄像,如果大家在這種呼叫中心使用的話,我們中文識別準(zhǔn)確率是94%以上,英語識別率是90%左右,粵語85%左右。我介紹一下我們語音技術(shù)在呼叫中心的應(yīng)用情況,首先我們介紹的還是語音導(dǎo)航的技術(shù),前面有一些朋友已經(jīng)介紹了什么是語音導(dǎo)航,語音導(dǎo)航解決什么問題,我從我的角度給大家介紹一下語音導(dǎo)航技術(shù)的一些特點。我本人從07年開始做一些語音導(dǎo)航的事情,在呼叫中心中間推廣,在電信和移動中間做了很長時間項目的經(jīng)驗,我做的項目中間我發(fā)覺,做語音導(dǎo)航項目比較困難的有幾點,第一點就是識別準(zhǔn)確率不行,用戶說的話沒有辦法被識別出來,現(xiàn)在我們云知聲音提供了一個準(zhǔn)確的識別度,我們有超過95%的識別準(zhǔn)確率。
第二點,在以前的語音識別系統(tǒng)中間或是語音導(dǎo)航中有一個比較痛苦的問題,我們往往是限定領(lǐng)域的識別,比如我們要定機票就必須問用戶你要從哪里書法,到哪里去,什么時間出發(fā),而且對于用戶的要求限制的非常嚴(yán)格。比如說舉個例子,我們只能說2014年4月17號從北京到上海的機票。如果用戶說的是其他解決方案,抱歉這個識別系統(tǒng)沒有辦法理解,什么原因呢,就是以前的識別系統(tǒng)都采用了語法的一種方式來限定它的識別領(lǐng)域。對于識別的內(nèi)容用戶沒有辦法用自然的語言理解描述。如果是明天北京到上海的機票,明天代表哪一天就沒有辦法識別,識別出來之后,通過精準(zhǔn)的語音分析把這一系列都解決好。
第三個就是以前的語音識別導(dǎo)航技術(shù)中,我們一個項目需要兩到一個月甚至更長的時候做優(yōu)化調(diào)整,可能你這個周期非常長。我們現(xiàn)在做了一些改變,我們支持標(biāo)準(zhǔn)的MR的協(xié)議,我們提供了一個定制的界面,我們以前做一個語音導(dǎo)航,你需要找錄音員錄音,設(shè)置它的VUR和一系列的流程,這些對于開發(fā)商或是集成商來說做起來比較慢,我們現(xiàn)在已經(jīng)提供給大家一個基本版本的定制化的VUR。大家一會可以看到我們已經(jīng)可以提供銀行、電信、旅游領(lǐng)域的一些定制的VUR,拿到我們這個VUR上線部署就可以了,只是把像外的名字和特殊信息調(diào)整一下就可以了,而不需要以前從頭到尾寫自己的流程和錄音。我們這一塊做了一個比較大的改變。
這邊請同事給我按一下多槽關(guān)鍵字演繹識別。大家可以看到,在這些當(dāng)中,這是一些熟練的用戶,非常清楚我要給系統(tǒng)說深告訴系統(tǒng)我要定貨車票是北京到青島的動車,我們通過多槽關(guān)鍵字識別技術(shù)就可以把這個說完整,得到相應(yīng)的結(jié)果。但是在很多情況下用戶說的話并不是很完整,比如說他只說了明天從北京出發(fā)的動車,到哪里不清楚,這時候怎么辦呢,我們可以IVR建立一個模擬人工的方式提供給大家服務(wù)。大家可以聽到,剛才的對話中間用戶少了一個出發(fā)目的地,以前的系統(tǒng)當(dāng)中出現(xiàn)這樣的情況識別出來的結(jié)果就是用戶需要定機票或是火車票,接下來就說從哪一天,從哪里到哪里做這種引導(dǎo)性的提問,用戶一個一個進(jìn)行確認(rèn),確認(rèn)完之后最后得到結(jié)果。
而大家可以看到,我們這種模型中間最大的特點就是,假設(shè)這一個通話過程中間我們需要收集用戶5個要素,缺三個或是缺兩個,我們可以通過對話模型引導(dǎo)用戶說出來。至于缺哪個沒有關(guān)系,我們可以通過優(yōu)先進(jìn)行判斷,這是通過我們語音識別和語義結(jié)合。以前導(dǎo)航系統(tǒng)做的交互,用戶打電話過來到找到的結(jié)果需要7、8次的交互,甚至?xí)r間更長,要跟用戶反復(fù)和系統(tǒng)對話,而我們現(xiàn)在交互控制在5次以內(nèi)就可以了。
這邊是給大家做的演示我們多槽識別和對話模型的演示,這是我們定制化VUR的演示,以前的話可能我們就沒有辦法做了,而只要我這個系統(tǒng)我們有一個定制性的VUR就可以了。我們請了專業(yè)的錄音人員,把菜單界面一句句錄好,大家直接從這里調(diào)用就可以了,也可以通過你的KBS往下使用就可以了。我們語音導(dǎo)航技術(shù)不僅是在我們電話的IVR系統(tǒng)中間可以得到使用,手機終端也可以得到使用。我們結(jié)合了語音和語義搭配了傳統(tǒng)的束縛。第二我們識別系統(tǒng)效率非常高,一個人講一分鐘的話,我們識別只需要0.2分鐘,如果是一秒鐘我們需要0.2秒鐘就可以提供相應(yīng)的結(jié)果。第二點就是我們能夠提供業(yè)界最經(jīng)濟高效的服務(wù)的支持能力,以前語音識別系統(tǒng)需要大量的計算,它效率一直是一個問題,其他廠商中間一些國外的廠商可能它單臺服務(wù)器運行的效率大概也就是在30到40左右,甚至比這個更低,而且我們現(xiàn)在可以達(dá)到全文轉(zhuǎn)寫80路。以前是寫一個限定的10個次或是100、一萬個次,除了這些之外的都沒有辦法識別,而我們把所有用戶交互的語音都寫成文字做語音分析,做這種理解,我們這樣全文轉(zhuǎn)寫的效率我們推薦的服務(wù)器可以達(dá)到80路的轉(zhuǎn)寫,讓大家做項目中間有更多的選擇。
這邊是我們做的一個簡單的手機上的一個導(dǎo)航的使用。大家可以把我們的手機系統(tǒng)跟APP無縫連接起來,使大家的用戶體驗更好一些,這是我們在一個某銀行掌上銀行中間做到的。比如用戶要錄入身份,我們對數(shù)字識別率非常高,達(dá)到了97%,如果選擇地區(qū)的話我們可以更加簡便解決用戶交互的問題。輸入手機號碼。大家可以看到,這是我的電話號碼,北京云知聲信息技術(shù)有限公司。這是一個簡單的DEMO告訴大家,我們不僅僅做IVR的導(dǎo)航,也可以做手機端的語音收入可以幫助大家更好的解決問題。
前面這是我們談到的語音導(dǎo)航方面,我們的特點就是我們是把語音和語義相結(jié)合的導(dǎo)航的方式,這種方式更加的符合大家的使用習(xí)慣。這是第一點,第二點就是我們?yōu)榇蠹姨峁┝艘粋€高度定制化的系統(tǒng),不管是VUR還是流程都給大家開發(fā)好了,不管你是用什么樣的平臺我們都是可以跨平臺調(diào)用的,這對大家使用起來非常的方便。后來我們來給大家簡單介紹一下語音質(zhì)檢的服務(wù)。
其實有很多嘉賓已經(jīng)跟大家介紹過了,什么是云質(zhì)檢,有什么好處,而我們云知聲只做轉(zhuǎn)寫,其他的事情不做。第一個階段我們要轉(zhuǎn)寫語音,第二要做大數(shù)據(jù)分析,大數(shù)據(jù)分析和挖掘是我們開發(fā)的金礦這一塊我們不碰的,我們做的事情就是語音轉(zhuǎn)寫,中間我們會做幾個事情,第一個我們會做這種準(zhǔn)確的說話人分離技術(shù),我們把原始語音中間擁護(hù)和坐席混合在一起的語音分離成兩股語音,一股是用戶的,一股是客戶的。然后接下來我們用我們超強的轉(zhuǎn)寫能力為大家提供這種轉(zhuǎn)寫的服務(wù)。我們現(xiàn)在轉(zhuǎn)寫到什么水平呢,我們現(xiàn)在服務(wù)器的引擎一分鐘能轉(zhuǎn)5到7分鐘的語音,我們一臺服務(wù)器80路并發(fā),一臺服務(wù)器上一個小時轉(zhuǎn)300到400個小時的錄音。各種錄音格式我們現(xiàn)在都可以支持,我們已經(jīng)和很多的廠商做過調(diào)試,我們也跟NICE也做了很好的合作協(xié)議。
同時我們還有一個非常大的特支持在線語音轉(zhuǎn)寫,意思就是用戶和客服通話過程中間,我們時時把大家的聲音轉(zhuǎn)成文字,提供給到我們的客服??头藛T可以通過他第一句搜索后面的知識庫,第二我們后臺管理人員也可以看我們有沒有服務(wù)寄語的問題和時長太長的問題,這也是我們可以提供的。我們提供這三塊的功能提供給大家,如果你想做語音的分析或是你現(xiàn)在是IVR的廠商想往下進(jìn)一步的深入的挖掘,我們就可以給大家提供這樣的平臺,至于后面大家做什么樣的分析,我們不管,我們只做前面的語音識別語音轉(zhuǎn)寫的事情,專業(yè)的人做專業(yè)的事情,我們就做這個活。
這就是我前面談到的問題。對于我們的產(chǎn)品大家有什么問題嗎?如果沒有什么問題就謝謝各位。
本新聞為51Callcenter原創(chuàng)稿件,轉(zhuǎn)載請注明出自51Callcenter。
謝謝!