以“速度”為主要社會特質(zhì)的“速度社會”,已成為社會情境和普遍的全球趨勢??旃?jié)奏的生活,已然成為當下人的生活方式。在這個數(shù)字化、信息化的時代,各式各樣的智能化服務,慢慢地融入到人們的生活當中,大家熟悉的天貓精靈、小度智能屏、小愛同學等智能產(chǎn)品背后,都是智能化服務的體現(xiàn)。人們在遇到問題的時候,無一例外,都想要快速、方便、有效地去解決。所以,智能客服應運而生。
智能客服系統(tǒng)是在大規(guī)模知識處理基礎上發(fā)展起來的一項面向行業(yè)應用的,適用大規(guī)模知識處理、自然語言理解、知識管理、自動問答系統(tǒng)、推理等等技術行業(yè)。
南方電網(wǎng)廣西電網(wǎng)公司客戶服務中心(以下簡稱“客服中心”),經(jīng)過近幾年的發(fā)展建設與運營管理,各渠道已具備一定自助/智能服務能力,逐步向“多元化、智能化”發(fā)展。并投入大量人力物力,致力發(fā)展人工智能客服,已達到給客戶提供最大便捷服務的目的。但是智能客服(以下簡稱智能機器人),真的那么智能,能夠無師自通,自我學習嗎?不,當然不能,所以就有了我的出現(xiàn)。
我是一名人工智能訓練師。
兩年前,我怎么也不會想到,我的工作會和人工智能扯上關系。一個偶然的機會,我通過競聘,獲得了這個對我來說新得不能再新的工作的機會,在此之前,公司只有人工客服業(yè)務。
從未接觸過人工智能的我,驚訝于智能機器人的能力,反應快,秒級響應客戶訴求,同時服務200位客戶,可以提供7*24小時服務,孜孜不倦不知疲憊,解決人工服務忙時回復難、回復慢、無人回復等問題,回復率可達200%!我知道,這是未來服務發(fā)展的趨勢,所以我毅然決然地投入到智能機器人訓練的行業(yè)中去。
首先要感謝公司給我這樣的機會去參加客服職業(yè)技能大賽,通過學習,讓我學到了很多訓練的方法,老師也對我平時一些訓練中遇到的問題進行了針對性的解答,受益匪淺。不過最重要的,大賽提供了一個可以跟其他同行業(yè)優(yōu)秀人才相互交流的平臺??梢愿蠹一ハ嘟涣飨到y(tǒng)、運營、訓練方面的問題,我感到非常榮幸。下面談一談我的心得體會。
這是一份枯燥又具有挑戰(zhàn)性的工作。是的,非??菰?,雖然直接面對的是新興的人工智能技術,但是從很多方面看,這都是一份機械和枯燥的工作。訓練師從上班開始面對的只有一個東西——數(shù)據(jù),要用大量的數(shù)據(jù)去教一個仿如白紙那般的機器人,讓智能機器人更“懂”人,通“人性”,從而更好地為人提供服務。這項工作很考驗耐心,需要把大量的數(shù)據(jù)進行整合,去除無效且無意義的數(shù)據(jù),把數(shù)據(jù)量轉化成有效的東西,這是一個很枯燥的過程。
目前人工智能的學習可分為全監(jiān)督學習、半監(jiān)督學習、無監(jiān)督學習、強化學習和遷移學習五種階段。
1.全監(jiān)督學習
即通過已有的訓練樣本,對智能產(chǎn)品進行訓練,從而得到一個最優(yōu)模型,再利用這個模型將所有新的數(shù)據(jù)樣本映射為相應的輸出結果,對輸出結果進行簡單的判斷,從而實現(xiàn)分類的目的。簡單來說,就是對智能機器人的每樣問題進行一一修正,即進行人工標注,并且需要全量標注。
2.半監(jiān)督學習
是在監(jiān)督學習的基礎上,對部分數(shù)據(jù)進行調(diào)整和優(yōu)化,并將部分數(shù)據(jù)調(diào)整優(yōu)化的結果交給機器人,讓它進行未教學數(shù)據(jù)的學習。簡單來說,就像是老師給學生上課,講解理論知識,再結合理論進行例題的講解,下課后給學生布置作業(yè),以此來檢驗學習效果。
3.無監(jiān)督學習
即事先沒有任何訓練數(shù)據(jù)樣本,需要直接根據(jù)數(shù)據(jù)進行建模。簡單來說,就像是學生上自習,老師在沒有任何講解的前提下直接給學生布置作業(yè),讓學生自己學習新的知識。
4.強化學習
即在沒有任何標簽的情況下,先嘗試做出一些行為得到一個結果,通過這個結果是對還是錯的反饋,調(diào)整之前的行為,在不斷地調(diào)整中,機器通過算法能夠?qū)W習到在什么情況下選擇什么樣的行為可以得到最好的結果。
5.遷移學習
是把已經(jīng)訓練好的模型參數(shù)遷移到新的模型來幫助新模型訓練。
首先一切的開始,要先明確企業(yè)所需要的機器人的類型,設計智能機器人的應答風格。智能機器人目前只能夠回答簡單,重復的問題,隨著智能機器人的普及,越來越多的公司,都開始使用智能機器人,但是很多客戶往往還是停留在老思想,不愿意讓機器人服務,認為機器人冷冰冰,不夠人性化,所以智能機器人的人物設定尤為重要。智能機器人定位,主要是設定智能機器人“人格化”特征的建立,首先定位智能機器人的形象,是專業(yè)的、可愛的、貼心的、還是溫暖的,這就需要在建立初期設定好、制定各項應答話術。試想一下,意思相同的一段話術,是一板一眼地直接發(fā)送給客戶,還是轉換成輕松,貼心的語句發(fā)送給客戶更能讓客戶接受呢?
其次需要根據(jù)智能機器人的業(yè)務要求,設計與構建智能知識庫,智能機器人應用的問答庫獨立于智能知識庫系統(tǒng),問答知識管理應遵循“即時更新、適應場景、面向客戶、通俗易懂”的原則,站在客戶的角度進行話術編寫,也就是我們在客服中心經(jīng)常會聽到的知識客戶化。
一般而言,客戶化是指通過多方面處理,使客戶對現(xiàn)有產(chǎn)品或服務方式更容易接受而使用的優(yōu)化過程及方法,知識的客戶化具體通過對企業(yè)現(xiàn)有知識在描述語言、呈現(xiàn)形式、獲取方式、編輯模式等方面進行制度化加工,使客戶在使用知識過程中擁有更好體驗的優(yōu)化方法。只有以客戶為出發(fā)點,才能更好地管理在線機器人、形成在線機器人對外發(fā)布的知識內(nèi)容。而這一系列動作,都是循序漸進的過程:
1.在建設初期,做好需求調(diào)研。
(1)確定服務范圍:智能機器人服務能力、服務場景及服務流轉。簡單來說,也就是明確智能機器人能夠做什么、能夠服務哪些業(yè)務場景。
(2)明確服務邊界,對于一些敏感詞、業(yè)務風險等級書、業(yè)務場景邊界等。需要明確在什么情況下,需要轉接人工處理,確保不會因為客戶不滿,而引發(fā)客戶投訴等問題。
2.設定目標值。
目標是一切行動的基礎,做業(yè)務梳理,實際上是通過分析,給智能機器人系統(tǒng)確定一個清晰的目標過程。通過業(yè)務梳理,確定智能客服系統(tǒng)的業(yè)務場景,有助于在遇到問題時,根據(jù)業(yè)務梳理的定義來確定問題是否需要解決、解決的優(yōu)先級和解決的方法。
3.語料的獲取及處理。
語料是未經(jīng)過加工,真實的服務聊天對話記錄,針對不同類型的語料,需要進行加工處理。在實際問答過程中,客戶的提問方式千奇百怪。比如簡簡單單一個繳費的問題,客戶會問“欠費了什么交費”“在哪交費”等等,這就需要訓練師將這類型問題標準化,然后編寫一些相似問題進行訓練。
先采用無監(jiān)督學習方式,直接讓機器人通過對應的算法進行初步分析,先給機器人導入大量人工客服與客戶的對話日志,在不經(jīng)過人工干預的情況下,讓機器人自發(fā)進行分析與研究。針對學習過程中的難點,由人工進行標注,再讓機器人對已標注數(shù)據(jù)進行學習并擴展認知未標注數(shù)據(jù)。搜集完數(shù)據(jù)后,需要將數(shù)據(jù)導入系統(tǒng)中,分解、聚類,再進行數(shù)據(jù)標注。數(shù)據(jù)標注是教智能機器人學習語句的過程,智能機器人是否能夠成長,這一步至關重要。
那么問題起來了,語料是不是越多越好呢?重復句需不需要去重呢?
其實完全無用的語料可以刪除,比如單純數(shù)字,及系統(tǒng)自動產(chǎn)生的無意義字符串;其次是太長或者太短的語料,這些內(nèi)容蘊含的信息量可能過多或者過少,容易對智能機器人問答的定位能力造成干擾;以及一句話包含兩個意思的語料,如“幫我看一下我的余額還有多少,我想繳費”“我停電了,我想繳費”等等,包含兩個意思的語料,需要分開匹配,不然容易造成智能機器人識別重疊而影響識別準確率;過多重復,類似的語料可以刪除,如“幫查一下電費”“查一下電費”等,機器人有自我學習能力,類似這樣的語料只需保留一個即可。
有標注就要有檢查,為確保每個標注人員的標注質(zhì)量,每月需抽取標注人員標注量進行質(zhì)檢,對存在的個性問題需及時向該坐席員進行傳遞,并跟進整改;對存在的共性問題形成分頭標注的校準樣本,集中進行培訓。
為統(tǒng)一各標注人員標注尺度,確保機器人對問題識別的一致性,每月組織開展標注校準工作,不斷統(tǒng)一標注人員的訓練標準。智能訓練師每次抽取不少于100條已標注樣本,組織智能在線班參與標注的坐席在時限內(nèi),采取“背靠背”的形式對同一份語料樣本進行標注,并將標注結果反映至人工智能訓練師進行匯總。制定出標注規(guī)則表,由標注人員統(tǒng)一按照規(guī)則表進行標注。
4.對話流設計。
數(shù)據(jù)標注完成后是對話流設計,當客戶問出一個問題時,機器人需要準確識別其場景或意圖,然后從知識庫中搜索核實的回答,如果數(shù)據(jù)標注是讓機器人學習知識,那么對話流設計就是讓機器人學會運用知識。
5.日常維護。
對話流設計成功后,是日常維護的工作,當客戶問到數(shù)據(jù)庫里未收錄的問題、問話時采用過多的修辭、方言口音過重時,機器人無法回答的情況下,就需要人工智能訓練師手動找到問題,進行調(diào)整。
人工智能現(xiàn)在還處在一個比較初級的階段,客戶會覺得一個這么簡單的問題,機器人為什么回答不上來,實際上如果模型不行或者初始語料不夠,以及考慮到算法在實際應用過程中限制,機器人就是不會回答。所以,訓練是一個漫長的過程,需要不斷地優(yōu)化,提升。
為了解智能機器人應答情況,確保機器人應答服務質(zhì)量,根據(jù)會話量抽取一定比例進行會話質(zhì)量復核分析,出現(xiàn)錯誤回復時會進行聯(lián)系客戶解答客戶問題,以確??蛻魡栴}能夠得到解決。對于發(fā)現(xiàn)的問題,進行分析,標注問題、系統(tǒng)問題、還是算法問題導致客戶問題無法解決,需后續(xù)跟進整改處理,確保下次遇到相同情況時,不會再出現(xiàn)問題。
其實機器人的訓練,都是一個從0-1,從無到有的過程,就像人從出生開始,接觸的第一個老師是自己的父母,上學之后就是老師,出社會之后是公司,社交圈等等,沒有一步登天的辦法,所有人都需要一個學習的過程,機器人也是一樣。在接觸到這個行業(yè)之后,看著機器人一天天地成長,看著自己的“學生”學到更多的知識,慢慢地變得更聰明,得到認可,得到表揚的時候,那種感覺,真的是無比地自豪,非常有成就感。未來人工智能技術會越來越好,人們的生活會越來越便利。