婷婷激情丁香六月开心五月,最新欧美精品一区二区三区,最新国产精品精品视频 视频,亚洲国产成人爱av网站,中文字幕av无码一区二区三区电影

首頁>> 公司信息>>新聞詳情

云知聲語音云第二次重大升級性能大幅提升

2013-04-25 11:15 《4PS呼叫中心國際標(biāo)準(zhǔn)研究中心》 咨詢電話:17317241681(微信同號)



    4月底“云知聲”的語音識別引擎進(jìn)行了一次升級,這是繼今年一月份使用深度神經(jīng)網(wǎng)絡(luò)(DNN)技術(shù)以來,云知聲語音的第二次重大升級。在這次升級中,識別引擎的識別率和響應(yīng)速度均提升了30%之多。熟悉模式識別的人都清楚,如果能夠通過某種方法將識別性能一次性提升10%以上,即便識別速度比原來還低,其成就也足夠在國際知名期刊上發(fā)一篇高質(zhì)量的論文了。云知聲此次能夠?qū)⒆R別率和速度同時(shí)提升30%,絕對令人咋舌。從目前的識別表現(xiàn)上來看,云知聲的語音識別準(zhǔn)確率已經(jīng)完全不亞于業(yè)內(nèi)大佬科大訊飛,而引擎的處理速度則超越所有競爭對手,是其他人的3到4倍。

    在語音領(lǐng)域內(nèi),提升語音識別準(zhǔn)確率的法寶大致有兩個(gè):一個(gè)是算法,即所謂“技術(shù)創(chuàng)新”;另一個(gè)則是數(shù)據(jù),即“數(shù)據(jù)驅(qū)動”。打個(gè)不太準(zhǔn)確的比方,如果說先進(jìn)的算法猶如一輛法拉利跑車,則海量的數(shù)據(jù)就是能令發(fā)動機(jī)發(fā)出震撼轟鳴的高性能汽油。讓一輛賽車高速前進(jìn),這二者缺一不可。但從某種程度上來說,先進(jìn)的算法可以在一定程度上彌補(bǔ)數(shù)據(jù)不足的缺陷;而海量的數(shù)據(jù)也可以從一定程度上提升算法的外在表現(xiàn)。云知聲的升級,靠的是是什么呢?

    眾所周知,海量線上數(shù)據(jù)的積累相當(dāng)不易,對于語音數(shù)據(jù)而言則更甚。語音的積累面臨著采集和標(biāo)注兩大難題,相當(dāng)費(fèi)時(shí)費(fèi)力。在語音引擎上線前的“種子期”,開發(fā)者一般會通過向相關(guān)機(jī)構(gòu)購買或者是請人錄音的方式來獲取標(biāo)注過的原始語音。但這種方式不太可能獲取“足夠”的語音,并且這類語音一般會跟線上的實(shí)際情況有較大差別(例如說話方式、用戶口音、設(shè)備質(zhì)量、環(huán)境噪音等等)。除非有極為先進(jìn)的算法,想基于這種數(shù)據(jù)來提供優(yōu)異的線上表現(xiàn)是相當(dāng)困難的。獲取數(shù)據(jù)的另一種方式就是通過滾動,即通過“服務(wù)上線->積累用戶->用戶提供語音->語音標(biāo)注->更新語音識別服務(wù)”的步驟來積累語音。這種語音積累方式由于數(shù)據(jù)精準(zhǔn)而且成本較低,因而是最為有效的。但這種方式需要以一定的用戶量為基礎(chǔ),如果初始的語音識別服務(wù)不夠好,吸引不來大量用戶貢獻(xiàn)語音,那么這種滾動方式純屬空談。這種模式對于比較成熟的語音識別服務(wù)商而言是必經(jīng)之路。拿科大訊飛來說,其通過公有云、訊飛口迅、訊飛語音輸入法以及訊飛語點(diǎn),在一家獨(dú)舞的情況下,經(jīng)過近3年的積累,其用戶語音庫用“海量”來形容毫不為過。而云知聲則是在2012年6月剛剛成立的小公司,雖然在與搜狗合作之后小有名氣,但無論在時(shí)間還是產(chǎn)品上,都不可與科大訊飛同日而語,因此云知聲想靠單一產(chǎn)品短期內(nèi)積累大量語音數(shù)據(jù)還是相當(dāng)困難的。

    云知聲的高識別率勝在其更新速度驚人。2013年的1月初,云知聲剛剛宣布了其語音識別服務(wù)性能的第一次大跨步改進(jìn),使用基于深度神經(jīng)網(wǎng)絡(luò)的語音模型替代了原有的基于高斯混合(GMM)的語音模型。如今時(shí)隔3個(gè)月,云知聲又進(jìn)行了第二次更新,不得不說,這在語音識別領(lǐng)域內(nèi)絕屬一個(gè)異類。

    語音作為人們獲取和溝通信息最方便、最有效的手段,智能語音交互技術(shù)對于各種移動互聯(lián)網(wǎng)終端改善用戶體驗(yàn)具有不可替代的作用,語音識別技術(shù)的升級將帶來更高的識別性能和更好的用戶體驗(yàn)。

    云知聲CEO梁家恩表示,“目前云知聲還有多項(xiàng)關(guān)鍵技術(shù)儲備,深度神經(jīng)網(wǎng)絡(luò)DNN技術(shù)只是其中之一。DNN主要是提高發(fā)音模型的匹配性能,今后,云知聲還會在抗噪音、方言覆蓋以及語言領(lǐng)域支持等方面持續(xù)投入。”

 

共0條評論網(wǎng)友評論
  • 全部評論
共0條記錄(共頁)
向您推薦

新聞 按行業(yè)分類

廠商 按產(chǎn)品分類


        
總機(jī):021-51601170 直線:021-58307717,17317241681(微信同號) 電子郵件:cct@51callcenter.com  瀘ICP備10026114號-4  行業(yè)交流俱樂部QQ:2919157212
地址:上海市浦東新區(qū)牡丹路60號東辰大廈810室  郵編:201204 上海趨天網(wǎng)絡(luò)技術(shù)服務(wù)有限公司 版權(quán)所有(2002-2018)