• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      AI訓(xùn)練師:讓人工智能更“懂”人

      2024-12-31 00:00:00彭歡雍娜吳曉玲曾錦熙
      大學(xué)生 2024年7期
      關(guān)鍵詞:沙柳人工機(jī)器人

      “人工智能一定要有人工才能智能?!绷_兵是一名有7年從業(yè)經(jīng)驗(yàn)的客服域AI訓(xùn)練師,他直言,在多數(shù)AI訓(xùn)練師看來(lái),離開(kāi)了人工,AI將不會(huì)存在。

      喂養(yǎng)AI

      AI行業(yè)是金字塔式構(gòu)造,底部眾多數(shù)據(jù)標(biāo)注員是整個(gè)行業(yè)必不可少的基石,他們負(fù)責(zé)對(duì)人工智能做繁瑣重復(fù)的喂養(yǎng)工作,這為整個(gè)AI模型提供了不可或缺的基礎(chǔ)。不同于金字塔頂端的技術(shù)人員,數(shù)據(jù)標(biāo)注員更像是喂養(yǎng)AI的“奶媽”。

      “寫(xiě)幾千、幾萬(wàn)條問(wèn)答,想讓AI變得更聰明,只能靠人來(lái)喂數(shù)據(jù)?!边@是婷婷入行后的感受,她需要為深圳一家互聯(lián)網(wǎng)公司的虛擬主播做數(shù)據(jù)標(biāo)注工作。

      婷婷對(duì)公司正在做的AI產(chǎn)品進(jìn)行描述時(shí),語(yǔ)氣中充滿了憧憬:“那是一個(gè)可以實(shí)時(shí)演算、能在平臺(tái)直播、能說(shuō)會(huì)唱,還能智能回復(fù)彈幕的3D虛擬歌手產(chǎn)品?!钡蔡寡?,“實(shí)際情況是目前還沒(méi)有做出來(lái),或者說(shuō)是現(xiàn)在的技術(shù)不足以支撐公司做出來(lái)。”

      婷婷每天的工作內(nèi)容很滿:一方面要跟算法對(duì)接,做好demo測(cè)試和數(shù)據(jù)分析,組織負(fù)責(zé)內(nèi)容創(chuàng)作的伙伴按算法要求打分,分析demo更新優(yōu)化等;另一方面還要進(jìn)行內(nèi)容創(chuàng)作、調(diào)研、設(shè)計(jì)、營(yíng)銷(xiāo)等。

      模型每天給婷婷“甩”過(guò)來(lái)上萬(wàn)條更新出來(lái)的文本問(wèn)答,她需要一條一條地優(yōu)化改寫(xiě),緊接著還要進(jìn)行評(píng)測(cè),對(duì)AI的答案進(jìn)行5分制打分,而且針對(duì)每一個(gè)答案都要給出具體判斷標(biāo)準(zhǔn)。這讓婷婷意識(shí)到,想讓人工智能變聰明,只能人為給它喂優(yōu)質(zhì)數(shù)據(jù)。但是,這和她原本對(duì)AI行業(yè)的期待背道而馳。

      出于對(duì)科幻電影、數(shù)碼產(chǎn)品和游戲的興趣,婷婷往這家人工智能公司投遞了簡(jiǎn)歷。她說(shuō):“當(dāng)時(shí)的我覺(jué)得科幻片里的場(chǎng)景是可以實(shí)現(xiàn)的?!比欢嬲哌M(jìn)這個(gè)行業(yè)后,以往對(duì)AI行業(yè)的期待與現(xiàn)實(shí)狀況產(chǎn)生了巨大落差。隨著參與的深入,婷婷發(fā)現(xiàn)數(shù)據(jù)喂養(yǎng)工作具有極大的可替代性,目前國(guó)外已經(jīng)出現(xiàn)了AI自動(dòng)標(biāo)注替代人工標(biāo)注的案例。同時(shí),行業(yè)內(nèi)部也存在極大的壁壘:有的年薪百萬(wàn),有的日結(jié)兩百。

      與婷婷的工作類(lèi)似,沙柳也是一名數(shù)據(jù)標(biāo)注員。作為一名自然語(yǔ)言大模型的數(shù)據(jù)標(biāo)注員,沙柳每天的工作內(nèi)容就是對(duì)模型進(jìn)行提問(wèn),再將模型輸出的回答進(jìn)行標(biāo)注。她需要標(biāo)注出最佳答案來(lái)優(yōu)化AI模型,不斷地標(biāo)注和訓(xùn)練是為了讓模型能夠在下一次的提問(wèn)中給出更好、更優(yōu)質(zhì)的答案。

      當(dāng)然,評(píng)判答案的優(yōu)劣并不是靠標(biāo)注員的知識(shí)水平和主觀感受,也無(wú)法人工寫(xiě)答案?!白顑?yōu)質(zhì)的答案都需要去生成,有時(shí)還需要檢驗(yàn)標(biāo)注后的內(nèi)容是否屬實(shí)?!?/p>

      但是,對(duì)于需要海量數(shù)據(jù)的模型來(lái)說(shuō),最主要的標(biāo)注宗旨就是確保答案沒(méi)有事實(shí)錯(cuò)誤,其次才是答案是否扣題、表達(dá)了什么觀點(diǎn)、對(duì)語(yǔ)言的理解能力如何、答案格式是否準(zhǔn)確等。

      這是一個(gè)高度重復(fù)性的工作,沒(méi)有太高的技術(shù)含量。沙柳說(shuō):“標(biāo)注工作需要耐心,本質(zhì)上是一個(gè)很枯燥的工作?!比绻褙炞⒐ぷ鳎刻斓墓ぷ髁?個(gè)小時(shí)就能完成,但也很費(fèi)眼睛。

      即便婷婷和沙柳都認(rèn)為這是一份單調(diào)且繁瑣的工作,但她們都無(wú)法否認(rèn)其在行業(yè)內(nèi)的價(jià)值:數(shù)據(jù)標(biāo)注是整個(gè)模型不可或缺的基礎(chǔ)。只要人工智能無(wú)法達(dá)到完全代替人的標(biāo)準(zhǔn),標(biāo)注工作就會(huì)永遠(yuǎn)存在。

      這就是行業(yè)目前面臨的困境:高可替代性,繁瑣重復(fù),卻又不可或缺。

      數(shù)據(jù)標(biāo)注工作看似簡(jiǎn)單易上手,但又必須具備嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度。比如,如果對(duì)自動(dòng)駕駛領(lǐng)域的標(biāo)注缺乏質(zhì)量把控,那么就無(wú)法讓汽車(chē)安全行駛在道路上。人工智能領(lǐng)域有一句流傳甚廣的話——人工智能行業(yè)有多少人工,就有多少智能。

      人工智能行業(yè)的發(fā)展?jié)摿o(wú)限,AI訓(xùn)練的基礎(chǔ)是標(biāo)注與喂養(yǎng),這是打造AI的第一步。

      “這是一個(gè)養(yǎng)孩子的過(guò)程”

      2020年,AI訓(xùn)練師正式成為新職業(yè)并納入國(guó)家職業(yè)分類(lèi)目錄。而在此之前,AI訓(xùn)練師在人才市場(chǎng)上的地位較為尷尬,既沒(méi)有對(duì)口的專(zhuān)業(yè),也缺乏相關(guān)的職業(yè)技能培訓(xùn)。

      羅兵說(shuō):“7年前,我剛?cè)胄械臅r(shí)候,很多都是空白的,只能自己去摸索?!庇捎诋?dāng)時(shí)深圳的AI企業(yè)尚未發(fā)展起來(lái),羅兵所在的公司只能從外地買(mǎi)回來(lái)一些機(jī)器人。“有不懂的地方,就請(qǐng)對(duì)方的產(chǎn)品經(jīng)理或者訓(xùn)練師給自己做一些培訓(xùn),不斷重復(fù)這一過(guò)程后,就會(huì)對(duì)產(chǎn)品有一個(gè)基本認(rèn)知,逐漸熟悉了操作訓(xùn)練機(jī)器人的后臺(tái)系統(tǒng),這樣就算入門(mén)了?!?/p>

      羅兵接觸并訓(xùn)練過(guò)許多類(lèi)型的機(jī)器人,而在客服域主要是文本機(jī)器人和語(yǔ)音機(jī)器人兩種。例如,購(gòu)物軟件中的機(jī)器人能回答售前、售中、售后的系列問(wèn)題;查詢快遞物流情況時(shí)輸入單號(hào),機(jī)器人就能調(diào)取包裹的物流軌跡,這些都是AI訓(xùn)練師訓(xùn)練機(jī)器人后的成果。通常,AI訓(xùn)練師需要根據(jù)應(yīng)用場(chǎng)景和面向人群,搜集一些語(yǔ)料(即語(yǔ)言材料)后輸入機(jī)器人模型中,并形成語(yǔ)料庫(kù)?!拔倚枰獙?duì)機(jī)器人進(jìn)行提問(wèn),判斷它的回答對(duì)不對(duì),如果不對(duì)的話,就要找出問(wèn)題的原因并進(jìn)行干預(yù)?!?/p>

      羅兵需要在人工客服中收集用戶咨詢最多的問(wèn)題,并將其進(jìn)行歸類(lèi),再來(lái)編輯話術(shù),即人為地配置一些常用并且描述清晰的問(wèn)題及其對(duì)應(yīng)回答,再把這些問(wèn)答“喂”給機(jī)器人。

      當(dāng)用戶進(jìn)行提問(wèn)時(shí),機(jī)器人會(huì)將用戶的問(wèn)題與所有配置好的問(wèn)答進(jìn)行相似度計(jì)算,找出最相似的問(wèn)題,并返回答案給用戶,這樣就完成了一次問(wèn)答操作。當(dāng)用戶提出的問(wèn)題不在設(shè)定好的范圍內(nèi)時(shí),就需要AI訓(xùn)練師去復(fù)盤(pán)總結(jié),通過(guò)不斷地復(fù)盤(pán),讓機(jī)器人盡可能回答用戶的所有疑問(wèn)。

      把大量的數(shù)據(jù)“喂”給機(jī)器人,是深度學(xué)習(xí)的一環(huán)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,本質(zhì)上就是讓機(jī)器或者程序變成一個(gè)人,擁有人的技能,可以模仿或者創(chuàng)造一些人能做的事情。

      曾在深圳一家互聯(lián)網(wǎng)大廠實(shí)習(xí)了4個(gè)月的憶如,對(duì)“喂”機(jī)器人有通俗理解:“比如,告訴機(jī)器人1+1=2是對(duì)的,1+1=3是錯(cuò)的。然后,再告訴它3+3=6,如果機(jī)器人說(shuō)等于5,那就給它打一個(gè)錯(cuò)誤的標(biāo)簽,機(jī)器人就會(huì)繼續(xù)學(xué)習(xí);如果機(jī)器人輸出的是6,那就證明機(jī)器人對(duì)這個(gè)任務(wù)能完成得比較好了。”

      進(jìn)行深度學(xué)習(xí)的過(guò)程,其實(shí)就是把大量的數(shù)據(jù)“喂”給機(jī)器或者程序,告訴它正確答案,讓它不斷學(xué)習(xí),讓它明白。

      憶如實(shí)習(xí)期間的工作與游戲AI相關(guān),他需要把王者榮耀中的“非玩家控制角色”(即NPC)訓(xùn)練得更加智能。怎樣去躲避別人的技能防止自己掉血(指玩家角色受到攻擊或受到特定條件影響而失去生命值)?怎樣在自己不掉血的情況下讓別人掉血?怎樣更快地使用技能?這些都是憶如需要對(duì)AI進(jìn)行強(qiáng)化訓(xùn)練的。

      不同于羅兵需要把客服機(jī)器人訓(xùn)練得舉一反三,憶如更偏向強(qiáng)化學(xué)習(xí)部分的工作,“不過(guò),強(qiáng)化學(xué)習(xí)只針對(duì)某一個(gè)具體應(yīng)用,讓游戲AI會(huì)做一件或者幾件事情,訓(xùn)練出來(lái)的也只是能跟用戶對(duì)打的NPC?!?/p>

      隨著AI訓(xùn)練師被納入國(guó)家職業(yè)分類(lèi)目錄,對(duì)該職業(yè)的考核標(biāo)準(zhǔn)也有了詳細(xì)規(guī)定。

      2022年,羅兵參加了深圳市人工智能訓(xùn)練師職業(yè)技能競(jìng)賽,并獲得了三等獎(jiǎng)。

      想要獲得職業(yè)認(rèn)證證書(shū),需要大量的職業(yè)技能培訓(xùn)。羅兵希望自己不局限于初級(jí)階段的工作,他不斷提升工作能力,學(xué)習(xí)更多的技能。他把自己達(dá)到一定水平后訓(xùn)練AI的工作,比作一個(gè)養(yǎng)孩子的過(guò)程,“因?yàn)檫@時(shí)候我能參與制定一些規(guī)則、搭建一些模型,機(jī)器人完全是根據(jù)我的想法去做的,這些機(jī)器人就像我的孩子一樣,它能成長(zhǎng)到什么地步完全取決于我?!?/p>

      “關(guān)關(guān)難過(guò)關(guān)關(guān)過(guò)”

      未來(lái),人工智能將在各個(gè)領(lǐng)域得到更深入更長(zhǎng)足的發(fā)展。在這個(gè)過(guò)程中,AI訓(xùn)練師扮演著重要角色,他們的工作對(duì)于機(jī)器學(xué)習(xí)模型的優(yōu)化和精準(zhǔn)性有著決定性的影響。

      然而,與日漸增長(zhǎng)的市場(chǎng)需求相比,專(zhuān)業(yè)AI訓(xùn)練師的缺口還是有些大。羅兵解釋說(shuō):“現(xiàn)在特別缺行業(yè)類(lèi)的訓(xùn)練師,比如金融類(lèi)的訓(xùn)練師,既要懂金融相關(guān)知識(shí),又要懂文本訓(xùn)練,還要懂機(jī)器人訓(xùn)練,這幾者要兼得其實(shí)是很難的?!边@就造成了一種尷尬境地:一面是大量的人才缺口,一面又是怎么都遞不過(guò)去的簡(jiǎn)歷。

      不過(guò),在羅兵看來(lái),人工智能未來(lái)的發(fā)展形勢(shì)一片大好。他說(shuō):“很多企業(yè)都需要客服,以前是通過(guò)人力不斷地去補(bǔ)充,現(xiàn)在雖然有了機(jī)器人,不過(guò)肯定還是需要一兩個(gè)人長(zhǎng)期去運(yùn)營(yíng),而這一兩個(gè)人是不會(huì)頻繁更換的?!?/p>

      也就是說(shuō),無(wú)論人工智能如何發(fā)展,機(jī)器都無(wú)法代替人類(lèi)?!八^人工智能,先有人工才會(huì)有智能。模型、規(guī)則都是人做的,機(jī)器是不可能取代人工的,否則人的存在就沒(méi)有意義了?!绷_兵說(shuō)。

      沙柳同樣認(rèn)為,人工智能與人工是相輔相成的,不會(huì)因?yàn)槿斯ぶ悄艿陌l(fā)展而導(dǎo)致人類(lèi)沒(méi)有工作可干。

      為了更好地發(fā)展人工智能,國(guó)家出臺(tái)了一系列針對(duì)AI訓(xùn)練師的政策。羅兵說(shuō):“深圳的人工智能協(xié)會(huì),定期會(huì)舉辦一些公益培訓(xùn)活動(dòng),培訓(xùn)完的AI訓(xùn)練師還能拿到政府的補(bǔ)貼和頒發(fā)的證書(shū)?!?/p>

      人工智能未來(lái)將如何發(fā)展,能夠發(fā)展到什么程度,或許我們都無(wú)法準(zhǔn)確預(yù)測(cè),但毋庸置疑的是,它正在深刻影響著我們。各式各樣智能化服務(wù)的出現(xiàn),給我們的生活、工作等各方面帶來(lái)了諸多便利。

      未來(lái),隨著人工智能技術(shù)的不斷發(fā)展和應(yīng)用,AI訓(xùn)練師的工作將充滿挑戰(zhàn)和機(jī)遇?!白鯝I訓(xùn)練師就像打游戲闖關(guān),你能通過(guò)不斷提升,從而獲得成就感。”今后,羅兵也會(huì)繼續(xù)在這條賽道上“關(guān)關(guān)難過(guò)關(guān)關(guān)過(guò)”。

      責(zé)任編輯:丁莉莎

      猜你喜歡
      沙柳人工機(jī)器人
      人工3D脊髓能幫助癱瘓者重新行走?
      軍事文摘(2022年8期)2022-11-03 14:22:01
      神木風(fēng)沙草灘區(qū)沙柳平茬復(fù)壯技術(shù)研究
      人工,天然,合成
      人工“美顏”
      新型多孔鉭人工種植牙
      荷花情
      木粉和抗氧劑對(duì)廢舊PE-HD/沙柳復(fù)合材料性能的影響
      花甲老漢單騎走中國(guó)
      機(jī)器人來(lái)幫你
      認(rèn)識(shí)機(jī)器人
      东乡族自治县| 江津市| 新建县| 拜城县| 潮州市| 新龙县| 浠水县| 拜城县| 竹北市| 宝丰县| 满城县| 塔城市| 宁武县| 乌海市| 庄河市| 呼伦贝尔市| 阜南县| 蒙阴县| 华阴市| 元谋县| 德江县| 高要市| 玉溪市| 石渠县| 武胜县| 柳州市| 峨眉山市| 小金县| 五寨县| 水富县| 北流市| 毕节市| 舒兰市| 赤壁市| 杭锦后旗| 株洲县| 资中县| 卢湾区| 蒙自县| 静安区| 宜春市|