據(jù)外媒 Neowin 今晚報道,微軟發(fā)布了“突破性(breakthrough)的” Live Interpreter API,將實時多語言翻譯能力引入 Azure Speech Translation。用戶無需設(shè)置輸入語言,就能實現(xiàn)流暢的跨語言溝通。
該功能支持 76 種語言和 143 個地區(qū),具備自動識別語言、低延遲、接近人工口譯的實時效果,還能使用個人語音保留說話者的風格和語氣。目前已開放公測。
IT之家附地址:Announcing Live Interpreter API - Now in Public Preview
這項 API 可用于多語言呼叫中心、在線會議、課堂教學、社交電商直播等場景,軟件開發(fā)者可以借此取消語言切換菜單,讓對話過程中自由切換語言。
其中的個人語音功能尤為亮眼,其能夠完整保留原說話者的語調(diào)和節(jié)奏,讓翻譯后的聲音聽起來更自然,并提供企業(yè)級的隱私和同意控制。
Live Interpreter API 基于 Azure Speech Translation 打造,能夠?qū)崿F(xiàn)連續(xù)語言識別、覆蓋所有支持語言、并提供低延遲的語音翻譯。
微軟官方的新聞稿提到,公司已與安克創(chuàng)新合作展示實際應用。安克創(chuàng)新表示:“我們很高興能與微軟合作,展示 AI 與日常科技結(jié)合的可能性。借助 Live Interpreter,我們?yōu)槿蛴脩魩砀悄?、直觀且沉浸的視聽體驗?!?/span>
微軟還提供了快速入門指南,方便開發(fā)者集成該功能。普通用戶無需直接操作 API,就能通過接入該能力的應用或網(wǎng)站體驗跨語言交流。