前言:
唐朝著名的邊塞詩人岑參在其知名的代表作《白雪歌送武判官歸京》中寫道:“忽如一夜春風(fēng)來,千樹萬樹梨花開?!庇靡悦枋霰眹唤荡笱彀籽┌}皚的景象,將白雪比作梨花,就好像是突然的一夜春風(fēng),千樹萬樹,漫山遍野的梨花都全部竟相的開放,帶給人們強(qiáng)列的視覺沖擊。2022年11 月 30日,美國人工智能公司 OpenAI 發(fā)布 ChatGPT 通用對(duì)話系統(tǒng),GPT的發(fā)布正好似岑參看到的大雪,給“所有的”AI之樹都裹上了銀裝。GPT(Generative Pre-trained Transformer)的發(fā)布對(duì)于技術(shù)路線的進(jìn)步、OPEN AI公司的發(fā)展來說是必然,但幾乎對(duì)所有“傳統(tǒng)的”人工智能行業(yè)從業(yè)者來看卻是非常的偶然。因此當(dāng)又一輪新的人工智能技術(shù)革新浪潮襲來,對(duì)于那些之前已經(jīng)在海水中弄潮沖浪且獲得了一定收獲的從業(yè)者來說,是“近乎放棄或重開一局”投入到大語言模型的軍備競(jìng)賽之中還是另辟蹊徑將二者相結(jié)合;對(duì)于還在岸上觀望技術(shù)發(fā)展與落地應(yīng)用的人們來說又該如何進(jìn)去這個(gè)賽道。對(duì)于原有AI從業(yè)者們已經(jīng)掌握的技能是否需要重新學(xué)習(xí)?大模型浪潮之下還需要掌握哪些技能才能讓自己穩(wěn)穩(wěn)立身于變革之中呢?這些都是AI從業(yè)者們普遍的困惑。為此,筆者根據(jù)多年人工智能服務(wù)產(chǎn)品產(chǎn)品的經(jīng)驗(yàn),從人員技能視角出發(fā),與大家共同探討大語言模型時(shí)代下一個(gè)重要的角色—人工智能訓(xùn)練師較之以往的工作的變與不變。
01武林至尊,寶刀屠龍。大語言模型對(duì)人工智能技術(shù)的變革與影響
人工智能技術(shù)自20世紀(jì)發(fā)展以來從最早的簡(jiǎn)單模型到現(xiàn)在的高度復(fù)雜模型,歷經(jīng)過多個(gè)關(guān)鍵的節(jié)點(diǎn),每個(gè)關(guān)鍵節(jié)點(diǎn)都對(duì)技術(shù)的發(fā)展與進(jìn)步起到不可獲取的技術(shù),但這些節(jié)點(diǎn)無一例外都是以一種漸進(jìn)和累積的方式逐步向前(如技術(shù)的進(jìn)步,產(chǎn)品的研發(fā)都是如此)。但GPT系列卻是以一種蠻橫的姿態(tài)出現(xiàn),GPT系列的發(fā)展不僅在技術(shù)上是一個(gè)巨大的飛躍,標(biāo)志著AI領(lǐng)域的迎來了一個(gè)新時(shí)代,大語言模型不僅在技術(shù)層面上取得了突破,也極大地?cái)U(kuò)展了AI的應(yīng)用范圍,從而引發(fā)了一場(chǎng)行業(yè)的變革。
如何衡量這種變革的影響呢?是打開各種短視頻軟件,通篇的大語言模型宣傳視頻還是全網(wǎng)鋪天蓋地的話題討論,這讓筆者想起了幼年時(shí)期曾經(jīng)看過的一本小說《倚天屠龍記》,其中有這么一段描寫:元朝末年,群雄逐鹿,武林動(dòng)蕩不安,江湖中流傳著“武林至尊,寶刀屠龍,號(hào)令天下,莫敢不從,倚天不出,誰與爭(zhēng)鋒”的傳說,武林中人對(duì)屠龍刀和倚天劍都趨之若鶩。屠龍寶刀的突然出現(xiàn)攪動(dòng)得江湖血雨腥風(fēng),所有的武林人士都投入到了屠龍寶刀的爭(zhēng)奪戰(zhàn)之中,而GPT系列的大語言模型推出,就好似屠龍寶刀一般,所有AI從業(yè)的公司都紛紛下場(chǎng)與轉(zhuǎn)型,躬身入局,2022年11月正式開啟大語言模型的大航海時(shí)代!
大語言模型究竟有何種魅力能夠造成如此之大的影響呢?
自從2018年BERT模型的出現(xiàn)打開了大語言模型的大門以來,GPT系列的推出更是如同一股不可阻擋的潮流,深刻地影響了人們對(duì)于人工智能能力的認(rèn)知。這些模型的共同特點(diǎn)是利用大規(guī)模的數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,通過學(xué)習(xí)海量文本中的語言模式,從而能夠執(zhí)行包括文本生成、語言理解、翻譯等多種自然語言處理任務(wù)。它們的出現(xiàn)不僅是技術(shù)進(jìn)步的體現(xiàn),更是對(duì)舊有AI應(yīng)用模式的一次顛覆。
從創(chuàng)新角度看,大語言模型有以下幾個(gè)吸引人的地方:
(1)高級(jí)理解和生成能力:大語言模型能夠理解復(fù)雜的語言表達(dá),并生成流暢、連貫的文本。這意味著它們可以用于自動(dòng)寫作、對(duì)話系統(tǒng)、內(nèi)容創(chuàng)作等多種應(yīng)用。
(2)泛化能力:通過在大規(guī)模數(shù)據(jù)集上預(yù)訓(xùn)練,這些模型學(xué)會(huì)了大量的語言知識(shí)和世界知識(shí),使得它們能夠在多種任務(wù)和領(lǐng)域中表現(xiàn)出色,甚至在未見過的任務(wù)上也能進(jìn)行一定程度的推理和應(yīng)用。
(3)可定制性和靈活性:雖然預(yù)訓(xùn)練模型已經(jīng)具備廣泛的知識(shí),但它們還可以通過微調(diào)(fine-tuning)進(jìn)一步專門化,以適應(yīng)特定的應(yīng)用或行業(yè)需求,從而提供更加個(gè)性化和高效的解決方案。
(4)加速創(chuàng)新和研究:大語言模型的開發(fā)和應(yīng)用推動(dòng)了自然語言處理(NLP)和人工智能(AI)領(lǐng)域的研究與創(chuàng)新,為解決復(fù)雜問題提供了新的工具和方法,促進(jìn)了技術(shù)的快速發(fā)展。
(5)多語言支持和跨文化交流:一些大型語言模型支持多種語言,能夠處理和生成非英語的文本,促進(jìn)了不同語言和文化背景人群之間的交流和理解。
(6)應(yīng)用多樣性:從文本摘要、機(jī)器翻譯、情感分析,到更復(fù)雜的如問答系統(tǒng)、法律文檔分析、創(chuàng)意寫作等,大語言模型的應(yīng)用幾乎遍及所有可以利用語言處理的領(lǐng)域。
若是回到智能服務(wù)領(lǐng)域,大語言模型則在以下幾個(gè)地方具備“傳統(tǒng)智能服務(wù)”所不具備的優(yōu)勢(shì):在智能服務(wù)產(chǎn)品側(cè),大語言模型的產(chǎn)品形態(tài)并未發(fā)生革命性的變化,即以前有智能文本、智能語音、智能助手、智能質(zhì)檢,大語言模型技術(shù)加載后還是這些產(chǎn)品,但其內(nèi)核或是其原子能力已經(jīng)發(fā)生了“鳥槍換炮”般的影響與變化了,如:
(1)語義理解能力:具備更好的人類自然語言理解能力,能夠有效解決以往所謂“答非所問,機(jī)器人聽不懂人類的話”這樣的情況出現(xiàn),具體則體現(xiàn)在如:流程生成、上下文理解、錯(cuò)別字糾偏、話術(shù)總結(jié)、關(guān)鍵成分分析、理解精度提升;
(2)推理能力:具備更強(qiáng)的邏輯推理能力,能夠在服務(wù)營(yíng)銷方面有更好的表現(xiàn),為客戶推薦更加精準(zhǔn)的產(chǎn)品,如:表格比較、產(chǎn)品推薦;
(3)生成能力:具備生成能力,能夠根據(jù)歷史文章、關(guān)聯(lián)文章為外部客戶推薦問題答案或者產(chǎn)品;為內(nèi)部服務(wù)人員提升工作效能,如:自動(dòng)生成歷史摘要,生成會(huì)話小結(jié),生成工單等等;
盡管大語言模型帶來的變革給許多行業(yè)帶來了前所未有的機(jī)遇,但它們的出現(xiàn)也引發(fā)了對(duì)于這種變革性質(zhì)的討論。一方面,這種變革可以被視為是技術(shù)發(fā)展的自然演進(jìn),是基于早期模型和算法不斷積累和優(yōu)化的結(jié)果。另一方面,它們所能實(shí)現(xiàn)的技術(shù)突破和應(yīng)用范圍的擴(kuò)展,也足以被定義為一場(chǎng)行業(yè)的顛覆。這種雙重性質(zhì)使得大語言模型時(shí)代的來臨,既有著漸進(jìn)的一面,也有著革命性的一面。
02茍能制侵陵,豈在多殺傷——AI或者大語言模型技術(shù)落地的關(guān)鍵要素
即然大語言模型技術(shù)或是加載大語言模型技術(shù)下的新AI技術(shù)帶來如此大的變革,那么企業(yè)究竟如何落地,落地的關(guān)鍵又在于何處?大語言模型的成功實(shí)施不僅能夠提升操作效率、改善客戶體驗(yàn),還能開辟新的商業(yè)機(jī)遇和增長(zhǎng)路徑。然而,技術(shù)本身的復(fù)雜性加上企業(yè)實(shí)際操作的復(fù)雜環(huán)境,使得AI技術(shù)的落地成為一項(xiàng)挑戰(zhàn)。成功落地的關(guān)鍵在于幾個(gè)方面的綜合施策,包括技術(shù)適配、人才培養(yǎng)、文化改革、戰(zhàn)略規(guī)劃,以及關(guān)鍵執(zhí)行的業(yè)務(wù)人員的作用。
因此從整體視角來看應(yīng)該包括:
(1)技術(shù)適配與集成:首先,企業(yè)需要評(píng)估現(xiàn)有系統(tǒng)的技術(shù)架構(gòu),確保它能夠與AI和大語言模型技術(shù)兼容。這可能需要升級(jí)現(xiàn)有的硬件、軟件或網(wǎng)絡(luò)架構(gòu),以支持這些技術(shù)的高性能運(yùn)算需求。同時(shí),技術(shù)集成是關(guān)鍵步驟,確保AI能夠無縫融入企業(yè)現(xiàn)有的工作流程,提升而非干擾日常操作。
(2)人才培養(yǎng)與團(tuán)隊(duì)構(gòu)建:盡管AI和大語言模型本身極為強(qiáng)大,但它們的實(shí)際應(yīng)用和持續(xù)優(yōu)化需要依賴于具備相關(guān)技能的人才。企業(yè)需要投資于人才培養(yǎng),包括培訓(xùn)現(xiàn)有員工和吸引外部專家,構(gòu)建一個(gè)能夠理解和應(yīng)用AI技術(shù)的團(tuán)隊(duì)。這個(gè)團(tuán)隊(duì)不僅需要包含算法科學(xué)家和代碼工程師,還應(yīng)該有能夠理解AI應(yīng)用價(jià)值并將其轉(zhuǎn)化為實(shí)際業(yè)務(wù)策略的產(chǎn)品經(jīng)理,以及實(shí)際落地應(yīng)用的人工智能訓(xùn)練師。
(3)文化轉(zhuǎn)變與管理支持:技術(shù)轉(zhuǎn)型成功的另一個(gè)關(guān)鍵因素是企業(yè)文化和管理層的支持。創(chuàng)新的技術(shù)引入往往伴隨著變革的陣痛,管理層需要為這種轉(zhuǎn)型提供清晰的視角和堅(jiān)定的支持。此外,建立一個(gè)鼓勵(lì)創(chuàng)新、容忍失敗的企業(yè)文化對(duì)于促進(jìn)技術(shù)創(chuàng)新和團(tuán)隊(duì)合作至關(guān)重要。
(4)戰(zhàn)略規(guī)劃與執(zhí)行:成功落地AI和大語言模型技術(shù)需要清晰的戰(zhàn)略規(guī)劃,包括確定技術(shù)引入的目標(biāo)、選擇合適的用例、分配資源以及制定實(shí)施時(shí)間表。然而,規(guī)劃僅是成功的一半,執(zhí)行力是將計(jì)劃轉(zhuǎn)化為現(xiàn)實(shí)的關(guān)鍵。這就需要依靠企業(yè)內(nèi)部的關(guān)鍵執(zhí)行業(yè)務(wù)人員,他們了解企業(yè)的業(yè)務(wù)流程、客戶需求以及市場(chǎng)動(dòng)態(tài),能夠確保技術(shù)應(yīng)用與企業(yè)的實(shí)際需求和長(zhǎng)期目標(biāo)保持一致。
綜上所述,AI和大語言模型技術(shù)的成功落地是一個(gè)多方面的挑戰(zhàn),需要技術(shù)、人才、文化和戰(zhàn)略的全面考慮。然而,最終的成功歸結(jié)于能夠?qū)⑦@些技術(shù)轉(zhuǎn)化為具體業(yè)務(wù)成果的關(guān)鍵執(zhí)行業(yè)務(wù)人員。他們是連接技術(shù)潛力與實(shí)際業(yè)務(wù)需求的橋梁,確保技術(shù)投資能夠轉(zhuǎn)化為企業(yè)的實(shí)際價(jià)值。因此,企業(yè)在推進(jìn)技術(shù)轉(zhuǎn)型的過程中,應(yīng)當(dāng)給予這些業(yè)務(wù)人員充分的信任和支持,為他們提供必要的資源和培訓(xùn),確保他們能夠在這一過程中發(fā)揮關(guān)鍵作用。
若是從整體視角對(duì)每個(gè)關(guān)鍵因素展開分析,大家可能會(huì)得出一個(gè)悲觀的理由那就是小企業(yè)或者中體量的企業(yè)根本無法應(yīng)用大語言模型,只能是理想的空中樓閣。但因?yàn)榻鼛资甑挠?jì)算機(jī)高速發(fā)展與技術(shù)紅利的存在,真實(shí)情況是幾乎所有的企業(yè)都能以很多種方式引進(jìn)人工智能、大語言模型,如AI agent(智能體)便是如今大模型落地業(yè)務(wù)場(chǎng)景的主流形式。因此,讓我們排除那些較為宏觀的干擾因素,聚焦到AI、大語言模型落地后的關(guān)鍵執(zhí)行業(yè)務(wù)人員。
想要分析的透徹,沒有遺漏那么就必須要有一條清晰的脈絡(luò)線來貫穿,接下來我們以大語言模型采購后落地企業(yè),企業(yè)開箱使用,使用后根據(jù)企業(yè)實(shí)際情況進(jìn)行自適應(yīng)優(yōu)化,優(yōu)化后積累行業(yè)經(jīng)驗(yàn)?zāi)芰Γ缓笤O(shè)計(jì)出適合于本行業(yè)的應(yīng)用模型,這一生命周期進(jìn)行分析可以發(fā)現(xiàn),關(guān)鍵人員需要承擔(dān)以下5大類角色;
(1)基礎(chǔ)開箱人員:企業(yè)購買了一套標(biāo)準(zhǔn)的大語言模型,需要在企業(yè)落地應(yīng)用,首先需要有一類開箱人員(把大語言模型當(dāng)成一個(gè)設(shè)備和系統(tǒng),使用之前需要先打開,讓其處于標(biāo)準(zhǔn)可運(yùn)轉(zhuǎn)的狀態(tài)),開箱人員的主要工作是根據(jù)模型開發(fā)者的要求,像其投喂合適的語料與數(shù)據(jù)即承擔(dān)數(shù)據(jù)標(biāo)注工作?;氐街悄芸头暯羌粗悄芸头涞仄髽I(yè)后,需要數(shù)據(jù)標(biāo)注員進(jìn)行數(shù)據(jù)采集(原始聊天對(duì)話日志),清洗數(shù)據(jù)(清洗原始聊天對(duì)話),標(biāo)注數(shù)據(jù)(根據(jù)模型要求進(jìn)行如編寫相似問、用戶意圖標(biāo)準(zhǔn)、多輪對(duì)話流設(shè)計(jì)等)。
(2)深度應(yīng)用人員:當(dāng)模型已經(jīng)開始上線且持續(xù)運(yùn)轉(zhuǎn)一段時(shí)間后,模型的業(yè)務(wù)指標(biāo)與結(jié)果不是那么的盡如人意或者需要擴(kuò)大應(yīng)用范疇(注:一般企業(yè)落地人工智能或者大語言模型幾乎都是采用試點(diǎn)方式,先進(jìn)行小范圍測(cè)試,達(dá)到效果后在擴(kuò)大應(yīng)用的業(yè)務(wù)范圍確保業(yè)務(wù)的穩(wěn)定),此時(shí)標(biāo)準(zhǔn)的模型已經(jīng)無法滿足企業(yè)業(yè)務(wù)發(fā)展的需求,那么關(guān)鍵業(yè)務(wù)人員所承擔(dān)的工作則是根據(jù)業(yè)務(wù)特征與相應(yīng)的人工智能或大語言模型的產(chǎn)品經(jīng)理共同研究分析,制定產(chǎn)品策略。如:智能客服上線后,機(jī)器人無法解決客戶問題,客戶選擇轉(zhuǎn)人工,但轉(zhuǎn)人工后坐席代表以一句“您好,有什么可以幫您的”惹惱客戶。根據(jù)這一業(yè)務(wù)痛點(diǎn)得出需要在機(jī)器人轉(zhuǎn)人工時(shí)增加一個(gè)“歷史會(huì)話摘要”的模型或功能。這類關(guān)鍵人員承擔(dān)了業(yè)務(wù)分析與產(chǎn)品選型、功能設(shè)計(jì)等職責(zé)。
(3)模型開發(fā)人員:一旦確定了需要開發(fā)或調(diào)整的新功能,如“歷史會(huì)話摘要”等,接下來的任務(wù)就落到了模型開發(fā)人員的肩上。這群人員通常具備深厚的技術(shù)背景,包括但不限于數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、軟件工程等領(lǐng)域。他們的主要職責(zé)是根據(jù)前期業(yè)務(wù)分析和產(chǎn)品策略的要求,進(jìn)行新模型的開發(fā)或現(xiàn)有模型的調(diào)整和優(yōu)化。這一過程中,模型開發(fā)人員需要緊密與基礎(chǔ)開箱人員和深度應(yīng)用人員合作,確保開發(fā)的模型能夠準(zhǔn)確地理解和滿足業(yè)務(wù)需求。工作內(nèi)容不僅包括編碼實(shí)現(xiàn),還包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練、測(cè)試以及迭代改進(jìn)等一系列復(fù)雜的工程活動(dòng)。此外關(guān)鍵執(zhí)行業(yè)務(wù)人員還需要積極參與模型測(cè)評(píng)、業(yè)務(wù)需求分析,以及模型開發(fā)與迭代期間的模型測(cè)試工作即類似于算法測(cè)試員的工作內(nèi)容,但這里的算法測(cè)試員更多是從業(yè)務(wù)應(yīng)用效果的角度與算法工程師共同完成測(cè)試工作。
(4)模型管理人員:在模型開發(fā)完成并投入使用后,需要有專人負(fù)責(zé)模型的日常管理和監(jiān)控工作,這就是模型管理人員的職責(zé)所在。他們負(fù)責(zé)監(jiān)控模型的運(yùn)行狀態(tài),包括性能評(píng)估、效果監(jiān)控、異常檢測(cè)等,以確保模型穩(wěn)定高效地服務(wù)于業(yè)務(wù)。此外,模型管理人員還需要定期對(duì)模型進(jìn)行維護(hù)和更新,比如根據(jù)新的數(shù)據(jù)對(duì)模型進(jìn)行重新訓(xùn)練,或者根據(jù)業(yè)務(wù)發(fā)展的需要調(diào)整模型參數(shù)。他們是確保模型長(zhǎng)期有效運(yùn)行的關(guān)鍵人員,其工作對(duì)于維護(hù)和提升企業(yè)人工智能、大語言模型應(yīng)用的質(zhì)量至關(guān)重要。同時(shí)模型管理人員還會(huì)承擔(dān)或者一定的架構(gòu)設(shè)計(jì)或者應(yīng)用層管理類、對(duì)外市場(chǎng)推廣類、商業(yè)模型制定類等對(duì)專業(yè)能力和綜合素質(zhì)都有較高要求的工作。
(5)模型設(shè)計(jì)人員:這類人員主要負(fù)責(zé)在模型開發(fā)前期,根據(jù)企業(yè)的業(yè)務(wù)需求和目標(biāo),設(shè)計(jì)出合適的模型架構(gòu)和算法選擇。模型設(shè)計(jì)人員需要具備深入的算法知識(shí)和業(yè)務(wù)理解能力,能夠預(yù)見不同設(shè)計(jì)選擇對(duì)模型性能和業(yè)務(wù)目標(biāo)的影響。他們的工作是整個(gè)模型開發(fā)流程的起點(diǎn),通過與業(yè)務(wù)分析人員、產(chǎn)品經(jīng)理等其他角色緊密合作,確定模型設(shè)計(jì)的最佳方案。模型設(shè)計(jì)不僅僅是技術(shù)活動(dòng),更是一種藝術(shù),需要設(shè)計(jì)人員在滿足技術(shù)可行性的同時(shí),也要兼顧業(yè)務(wù)的實(shí)際需求和約束。
03新事物的誕生,舊事物必將死亡?
從上文的分析,我們得出了大語言模型落地企業(yè)的關(guān)鍵業(yè)務(wù)執(zhí)行人員的主要工作類別,同時(shí)也分析出大語言模型技術(shù)具有傳統(tǒng)AI技術(shù)的積累與舊AI應(yīng)用模式的顛覆式創(chuàng)新雙重性質(zhì)。那么傳統(tǒng)的人工智能技術(shù)與大語言模型的關(guān)鍵業(yè)務(wù)執(zhí)行人員從工作內(nèi)容視角又是一種怎么樣的關(guān)系呢?唯有搞清兩者之間的關(guān)系才能明白究竟原來學(xué)習(xí)的人工智能知識(shí)在大語言模型時(shí)代是繼承后在學(xué)習(xí)還是從零開始。
說起傳統(tǒng)人工智能在企業(yè)落地所產(chǎn)生的新工作一定無法繞開“人工智能訓(xùn)練師”這一關(guān)鍵的角色,根據(jù)相關(guān)報(bào)道數(shù)據(jù)“人工智能訓(xùn)練師”從概念發(fā)展為新職業(yè),其從業(yè)人員從0發(fā)展到20萬,只用了四年時(shí)間。2020年2月,“人工智能訓(xùn)練師”正式成為新職業(yè)并納入國家職業(yè)分類目錄。人社部對(duì)人工智能訓(xùn)練師的職業(yè)定義為:“人工智能訓(xùn)練師新職業(yè)隸屬于軟件和信息技術(shù)服務(wù)人員小類,主要工作任務(wù)包括:標(biāo)注和加工原始數(shù)據(jù)、分析提煉專業(yè)領(lǐng)域特征,訓(xùn)練和評(píng)測(cè)人工智能產(chǎn)品相關(guān)的算法、功能和性能,設(shè)計(jì)交互流程和應(yīng)用解決方案,監(jiān)控分析管理產(chǎn)品應(yīng)用數(shù)據(jù)、調(diào)整優(yōu)化參數(shù)配置等?!?br />
人工智能(AI)訓(xùn)練師在人工智能技術(shù)落地的過程中扮演著至關(guān)重要的角色。他們的工作不僅涉及到技術(shù)層面,更關(guān)鍵的是連接技術(shù)與實(shí)際業(yè)務(wù)需求的橋梁,確保AI技術(shù)能夠高效、有效地解決實(shí)際問題。人工智能訓(xùn)練師的關(guān)鍵作用與重要性如下:
(1)數(shù)據(jù)準(zhǔn)備與預(yù)處理:AI訓(xùn)練師負(fù)責(zé)收集、清洗和標(biāo)注數(shù)據(jù),這是AI模型訓(xùn)練的基礎(chǔ)。他們確保數(shù)據(jù)質(zhì)量和數(shù)據(jù)的代表性,從而使得訓(xùn)練出的模型能夠準(zhǔn)確反映現(xiàn)實(shí)世界的復(fù)雜性和多樣性。
(2)模型訓(xùn)練與優(yōu)化:通過選擇合適的算法和參數(shù)設(shè)置,AI訓(xùn)練師對(duì)模型進(jìn)行訓(xùn)練和調(diào)優(yōu)。他們需要不斷試驗(yàn)和評(píng)估不同的訓(xùn)練方法,以找到最優(yōu)的模型配置,從而提升模型的性能和準(zhǔn)確度。
(3)橋接業(yè)務(wù)需求與技術(shù)實(shí)現(xiàn):AI訓(xùn)練師深入理解業(yè)務(wù)需求,并將這些需求轉(zhuǎn)化為可執(zhí)行的AI解決方案。他們與業(yè)務(wù)團(tuán)隊(duì)緊密合作,確保開發(fā)的AI模型能夠解決實(shí)際業(yè)務(wù)中的問題,增強(qiáng)業(yè)務(wù)流程的智能化和自動(dòng)化水平。
(4)監(jiān)控、評(píng)估與迭代改進(jìn):部署后的模型需要持續(xù)的監(jiān)控和評(píng)估,AI訓(xùn)練師負(fù)責(zé)監(jiān)測(cè)模型性能,及時(shí)發(fā)現(xiàn)并糾正偏差或不足。他們還需根據(jù)業(yè)務(wù)環(huán)境的變化或新的數(shù)據(jù),對(duì)模型進(jìn)行迭代更新和優(yōu)化,保證模型始終保持最佳性能。
(5)知識(shí)傳遞與培訓(xùn):AI訓(xùn)練師還承擔(dān)著向非技術(shù)人員傳授AI知識(shí)和技能的責(zé)任,幫助業(yè)務(wù)團(tuán)隊(duì)理解AI技術(shù)的潛力和限制。這種跨領(lǐng)域的知識(shí)傳遞對(duì)于促進(jìn)團(tuán)隊(duì)之間的溝通、協(xié)作非常關(guān)鍵,有助于整個(gè)企業(yè)更好地利用AI技術(shù)。
綜上所述,人工智能訓(xùn)練師在AI技術(shù)落地的過程中起著不可或缺的作用。他們不僅需要具備深厚的技術(shù)知識(shí),還需要了解業(yè)務(wù)需求,并具備跨領(lǐng)域溝通的能力。通過他們的工作,可以確保AI技術(shù)能夠有效地解決實(shí)際問題,助力企業(yè)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型和智能化升級(jí)。
基于人工智能訓(xùn)練師在人工智能技術(shù)落地的重要地位,因此2021年底人社部、工信部等單位共同參與制定的新一批“國家職業(yè)技能標(biāo)準(zhǔn)目錄”正式對(duì)外公布。其中,人工智能訓(xùn)練師作為一門新興職業(yè)被納入此次公布的標(biāo)準(zhǔn)中,并在《人工智能訓(xùn)練師國家職業(yè)技能標(biāo)準(zhǔn)(2021年版)》(下文簡(jiǎn)稱為《標(biāo)準(zhǔn)》)中對(duì)該職業(yè)的活動(dòng)內(nèi)容進(jìn)行了明確的規(guī)定,同時(shí)也對(duì)各等級(jí)從業(yè)者的技能水平和理論知識(shí)水平進(jìn)行了規(guī)范細(xì)致的描述。在該標(biāo)準(zhǔn)中對(duì)人工智能訓(xùn)練師的職業(yè)定義有了更進(jìn)一步的闡述:“使用智能訓(xùn)練軟件,在人工智能產(chǎn)品實(shí)際使用過程中進(jìn)行數(shù)據(jù)庫管理、算法參數(shù)設(shè)置、人機(jī)交互設(shè)計(jì)、性能測(cè)試跟蹤及其他輔助作業(yè)的人員。本職業(yè)包含數(shù)據(jù)標(biāo)注員、人工智能算法測(cè)試員兩個(gè)工種?!蓖瑫r(shí)該職業(yè)標(biāo)準(zhǔn)還從數(shù)據(jù)采集和處理、數(shù)據(jù)標(biāo)注、智能系統(tǒng)運(yùn)維、業(yè)務(wù)分析、智能訓(xùn)練、智能系統(tǒng)設(shè)計(jì)等參考維度,劃分出了五個(gè)職業(yè)等級(jí);五個(gè)職業(yè)等級(jí)依照數(shù)據(jù)采集和處理、數(shù)據(jù)標(biāo)注、智能系統(tǒng)運(yùn)維、業(yè)務(wù)分析、智能訓(xùn)練、智能系統(tǒng)設(shè)計(jì)等參考維度劃分,從五級(jí)/初級(jí)工到一級(jí)/高級(jí)技師,人工智能訓(xùn)練師的職業(yè)技能要求依次遞進(jìn)。
當(dāng)我們仔細(xì)閱讀該標(biāo)準(zhǔn)后能得到一個(gè)驚人的發(fā)現(xiàn),即人工智能訓(xùn)練師的工作內(nèi)容職業(yè)與上文中我們所分析的大語言模型落地的關(guān)鍵執(zhí)行業(yè)務(wù)人員的工作內(nèi)容有著驚人的相似,大語言模型這一新生事物的出現(xiàn),所帶來人員工作內(nèi)容的變化并不是非0即1的舊事物死亡,而是在舊事物的基礎(chǔ)之上有了更新的解讀和工作環(huán)境、工作細(xì)則的變化,但其中的關(guān)鍵邏輯依然一脈相承。
04 龍蛇之變,木雁之間
新事物的誕生往往基于舊事物的演進(jìn)之上,雖表面呈現(xiàn)為顛覆性創(chuàng)新,其實(shí)內(nèi)部卻保持著復(fù)雜而深刻的聯(lián)系。在新事物完全成型與普及之前,迷茫與猶豫常常是普遍的情緒。在大語言模型席卷行業(yè)的過去一年,這種迷茫與猶豫也常常出現(xiàn)于筆者的心中,莊子有云“木雁之間、龍蛇之變”,因此我們更不應(yīng)該放棄或者躺平而是積極尋求解決方法,積累自己的力量。那么對(duì)于原有的人工智能訓(xùn)練師來說如何更好適應(yīng)技術(shù)變化帶來的工作內(nèi)容變化,可以從以下幾個(gè)點(diǎn)出發(fā):
(1)技術(shù)理解能力:需要對(duì)人工智能和機(jī)器學(xué)習(xí)的基本原理有深入的了解,特別是大語言模型的工作原理、架構(gòu)以及它們?nèi)绾伪挥?xùn)練和部署。
(2)數(shù)據(jù)處理能力:強(qiáng)大的數(shù)據(jù)處理能力是必須的,包括數(shù)據(jù)收集、清洗、標(biāo)注和預(yù)處理,以確保數(shù)據(jù)的質(zhì)量和多樣性,從而訓(xùn)練出更準(zhǔn)確和高效的模型。
(3)代碼理解與提示詞編寫:熟練掌握至少一種編程語言(如Python),以及掌握相關(guān)的機(jī)器學(xué)習(xí)庫和框架(如TensorFlow、PyTorch),能夠自主進(jìn)行模型調(diào)試和優(yōu)化。
(4)問題解決能力:在訓(xùn)練過程中,需要能夠識(shí)別和解決各種問題,如過擬合、欠擬合、數(shù)據(jù)偏差等,以及能夠針對(duì)特定應(yīng)用場(chǎng)景調(diào)整模型參數(shù)。
(5)溝通和協(xié)作能力:與數(shù)據(jù)科學(xué)家、產(chǎn)品經(jīng)理、開發(fā)者等多個(gè)角色有效溝通,確保大語言模型的訓(xùn)練目標(biāo)和業(yè)務(wù)需求的一致性。
(6)倫理和法律知識(shí):理解人工智能的倫理原則和相關(guān)法律法規(guī),確保模型訓(xùn)練和應(yīng)用過程中的數(shù)據(jù)隱私、安全和公平性。
(7)持續(xù)學(xué)習(xí)能力:人工智能和機(jī)器學(xué)習(xí)領(lǐng)域快速發(fā)展,訓(xùn)練師需要持續(xù)學(xué)習(xí)最新的研究成果和技術(shù)動(dòng)態(tài),以便不斷優(yōu)化模型和訓(xùn)練方法。
(8)創(chuàng)新思維:在快速變化的技術(shù)環(huán)境中,擁有創(chuàng)新思維能夠幫助訓(xùn)練師探索新的解決方案,提出改進(jìn)模型性能和效率的新方法。
其中,現(xiàn)有的大語言模型大都還是依賴于提示詞編寫能力,無論是ChatGPT還是最新驚艷世人的Sora,因此當(dāng)前人工智能訓(xùn)練師對(duì)于提示詞的學(xué)習(xí)也是重中之重,有效利用和設(shè)計(jì)提示詞(prompts)來引導(dǎo)或改善大語言模型的輸出。這種能力對(duì)于提升模型性能和適應(yīng)性至關(guān)重要,涉及以下幾個(gè)方面:
(1)提示詞設(shè)計(jì):訓(xùn)練師需要能夠設(shè)計(jì)出精準(zhǔn)、高效的提示詞,這些提示詞能夠明確地向模型傳達(dá)期望的任務(wù)類型、輸出格式和語言風(fēng)格。這要求訓(xùn)練師深入理解模型的工作機(jī)制,以及如何通過不同的提示詞影響模型的行為。
(2)語境理解與應(yīng)用:掌握提示詞能力意味著能夠根據(jù)具體的應(yīng)用場(chǎng)景和上下文環(huán)境,調(diào)整和優(yōu)化提示詞。這包括理解不同領(lǐng)域的專業(yè)術(shù)語、用戶意圖以及文化差異,以確保模型輸出的相關(guān)性和適用性。
(3)實(shí)驗(yàn)和迭代:有效的提示詞往往需要通過反復(fù)的實(shí)驗(yàn)和迭代來優(yōu)化。訓(xùn)練師應(yīng)具備設(shè)計(jì)實(shí)驗(yàn)、分析結(jié)果和調(diào)整策略的能力,以找到最優(yōu)的提示詞設(shè)置。
(4)創(chuàng)新與策略開發(fā):在某些情況下,標(biāo)準(zhǔn)的提示詞可能無法達(dá)到預(yù)期效果,這要求訓(xùn)練師具備創(chuàng)新思維,能夠開發(fā)新的策略和方法來提升模型的表現(xiàn)。這可能包括結(jié)合多個(gè)提示詞、使用條件性提示詞或開發(fā)動(dòng)態(tài)提示詞系統(tǒng)。
(5)評(píng)估和優(yōu)化:掌握提示詞能力還包括能夠準(zhǔn)確評(píng)估提示詞對(duì)模型性能的影響,并據(jù)此進(jìn)行優(yōu)化。這需要對(duì)模型輸出的質(zhì)量進(jìn)行細(xì)致的分析,識(shí)別可能的偏差或不足,并據(jù)此調(diào)整提示詞設(shè)計(jì)。
(6)跨領(lǐng)域應(yīng)用:最后,強(qiáng)調(diào)提示詞能力的掌握還意味著能夠跨領(lǐng)域應(yīng)用這一技能。無論是在醫(yī)療、法律、教育還是娛樂領(lǐng)域,有效的提示詞設(shè)計(jì)都是提升大語言模型應(yīng)用效果的關(guān)鍵。
寫在后面:
在探討大語言模型技術(shù)顛覆式的創(chuàng)新與AI技術(shù)演進(jìn)的長(zhǎng)河之中,筆者認(rèn)為”龍蛇之變,木雁之間”是非常恰當(dāng)?shù)年P(guān)鍵詞,寓意著變革(“大語言模型”)與傳承(“傳統(tǒng)AI”)的深刻哲理。這一概念既描繪了歷史與現(xiàn)實(shí)中的劇烈變動(dòng),也象征了在這些變化中尋找到的連續(xù)性和穩(wěn)定性。龍蛇,作為中國文化中變化與動(dòng)力的象征,代表著技術(shù)革命和思想觀念的迅猛發(fā)展,它們?cè)谏鐣?huì)的每個(gè)角落激蕩著變革的波瀾;而木雁,則象征著歷史的傳承與文化的連續(xù),無聲地在變革的浪潮中堅(jiān)守著根基和精神。
在大語言模型技術(shù)突如其來席卷全球的背景之下,個(gè)體從業(yè)者和企業(yè)都面臨著如何適應(yīng)和引領(lǐng)變革的挑戰(zhàn)?!饼埳咧儭币笪覀儾粩鄬W(xué)習(xí)新技術(shù)、掌握新知識(shí)、適應(yīng)新趨勢(shì),以創(chuàng)新的思維和方式解決問題,推動(dòng)AI技術(shù)向前發(fā)展?!饼埳咧?,木雁之間”不僅是對(duì)當(dāng)前AI大變革的描述,更是對(duì)未來發(fā)展道路的指引。在這個(gè)過程中,每個(gè)從業(yè)者都將是參與者,我們既是新AI(大語言模型)的推動(dòng)者,也是舊AI的傳承者。通過不斷的學(xué)習(xí)新知識(shí),我們可以在這場(chǎng)AI的長(zhǎng)河中找到自己的位置,既能駕馭”龍蛇”之變,又能在”木雁”之間找到安寧和智慧,共同奮進(jìn)。