曲利紅,李俊芹
(鄭州電子信息職業(yè)技術(shù)學(xué)院,河南 鄭州 450000)
隨著科學(xué)技術(shù)的不斷發(fā)展與進步,人工智能(Artificial Intelligence,AI)已經(jīng)逐漸滲透到人們的日常生活當中,給人們的生產(chǎn)生活帶來極大便利[1]。無論是在工業(yè)企業(yè)主體,還是在個體生活,AI技術(shù)都有所體現(xiàn)。人機交互的現(xiàn)象普遍泛化,包括物聯(lián)網(wǎng)、智能語音、遠程控制及計算機編程等。從發(fā)展趨勢來看,AI技術(shù)的地位越來越重要,人機交互的頻率會越來越高。因此,做好對AI技術(shù)路線與人機傳播新范式的分析與研究,具有重要的意義。
從宏觀意義上理解,AI指的是像人類一樣思考的機器。從微觀意義上理解,AI可以模擬人的意識和思維,像人類一樣思考,還可以讓機器勝任一些通常需要人類智能才能完成的復(fù)雜工作。在AI的發(fā)展歷程中,可以從3個方面來理解AI技術(shù)路線的組成[2]。
AI基礎(chǔ)技術(shù)路線主要包括大量的數(shù)學(xué)知識、計算機科學(xué)理論、數(shù)據(jù)分析和處理方法以及自然語言處理技術(shù)等多個方面,這些技術(shù)共同構(gòu)成了AI領(lǐng)域的基礎(chǔ)和核心。其中,語言學(xué)和計算語言學(xué)是自然語言處理的基礎(chǔ)。數(shù)據(jù)是AI的重要組成部分。系統(tǒng)囊括了軟件部分的算法模型、硬件部分的芯片及傳感器等內(nèi)容。AI技術(shù)之所以能夠得到快速發(fā)展,其內(nèi)核因素是先進的技術(shù)層,既能夠直接影響AI整體的發(fā)展效果與速度,又能夠決定實際應(yīng)用中智能化產(chǎn)品的最終效果。現(xiàn)階段,AI技術(shù)的核心機制是通過算法或者函數(shù)模擬人類思維。想要實現(xiàn)這一目標,必須依靠高性能的硬件設(shè)施,才能更好地發(fā)揮算法、模型的作用,實現(xiàn)對相關(guān)數(shù)據(jù)的高效精準處理。
當前,基礎(chǔ)技術(shù)路線中的主要硬件有圖形處理器(Graphics Processing Unit,GPU)、現(xiàn)場可編程邏輯門陣列(Field Programmable Gate Array,F(xiàn)PGA)、專用集成電路(Application Specific Integrated Circuit,ASIC)等內(nèi)容。該部分硬件能夠為AI的高效運算創(chuàng)設(shè)優(yōu)良的算力,包括但不限于數(shù)據(jù)推斷與訓(xùn)練。AI的落腳點是使計算機通過對人類行為進行學(xué)習(xí)、模擬等方式,以精準、高效的狀態(tài)解決實際任務(wù),如進行低層次的感知、推理、預(yù)測、預(yù)處理及識別等,都是AI化的過程內(nèi)容,即使計算機感知、模擬人類的學(xué)習(xí)行為,實現(xiàn)快速解決具體問題與任務(wù),服務(wù)人類。就現(xiàn)階段基礎(chǔ)技術(shù)路線的實際發(fā)展情況而言,現(xiàn)階段的AI依然存在明顯不足,需要滿足多種條件后才能發(fā)揮作用。比如圖像領(lǐng)域技術(shù)不能在語言領(lǐng)域直接應(yīng)用。因此,這一層面的技術(shù)路線發(fā)展,必須以突破弱AI的瓶頸為目標,逐漸搭建起強AI的基礎(chǔ)框架。
隨著科學(xué)技術(shù)的進步,如今各類芯片技術(shù)以及算法技術(shù)的升級與成熟,為AI的中間技術(shù)提供了有力支撐。以此為基礎(chǔ),AI發(fā)展出了包括計算機視覺、語音識別、自然語言處理等在內(nèi)的技術(shù)路線和方向,被廣泛應(yīng)用于現(xiàn)實生活當中。作為AI市場最重要的組成部分,計算機視覺的發(fā)展十分迅速,在各個領(lǐng)域得到了廣泛的應(yīng)用。它主要是通過計算機所具備的照相功能替代人類的雙眼,對圖像中的目標進行識別、跟蹤和測量,進而識別圖像中的目標信息。AI中計算機的視覺過程涵蓋識別物體與理解場景,計算機以算法為基礎(chǔ),對目標的外觀特征進行識別、提取并分類,建立起目標物體之間的聯(lián)系,從而對場景完成判斷并做出決策。當前,計算機視覺在人臉識別、影像診斷、視頻監(jiān)管等多個領(lǐng)域都得到了重要應(yīng)用。
語音識別技術(shù)是利用深度學(xué)習(xí)等算法對語音信號進行處理和分析,將語音轉(zhuǎn)換為文本或命令,讓機器識別人類語言,使人機交互更加自然和便捷。其中,技術(shù)過程包含語音收集、語音特征篩選、語音的模擬訓(xùn)練以及語音的甄別等。算法訓(xùn)練指的是對海量的語音數(shù)據(jù)進行知識挖掘、信號處理,識別過程是對人的語音予以自動識別?,F(xiàn)階段,語音識別技術(shù)在智能家居、醫(yī)療、車載系統(tǒng)等領(lǐng)域有廣泛的應(yīng)用前景,比如口語測試系統(tǒng)、醫(yī)療系統(tǒng)以及語音輸入系統(tǒng)等。在這些領(lǐng)域,通用智能技術(shù)可以實現(xiàn)利用語音指令來完成身份識別、文字錄入、搜索查閱及事務(wù)安排等多種任務(wù),不僅提高了人們的生活與工作效率,而且簡化了工作過程。再如各種軟件中的語音助手、汽車系統(tǒng)中的語音識別、各種智能語音音箱及手機等智能終端等。自然語言處理指的是計算機與人之間能夠運用自然語言完成交流的過程,包含了計算機對自然語言文本的理解以及利用自然語言完成表達這兩方面的內(nèi)容,可以被歸類為AI領(lǐng)域的核心技術(shù)。比如人們常用的谷歌翻譯,就屬于自然語言處理技術(shù)層面,此外還有一些搜索引擎、聊天機器人等。總體來說,AI中間技術(shù)路線的發(fā)展對人們生活的便利性、智能化起到了非常重要的作用。
AI的創(chuàng)造與應(yīng)用,最終目的是服務(wù)于人,可以最大限度地發(fā)揮機器的先進作用,從而使人們的生活變得更加美好。如今,在各項技術(shù)的支持下,AI已經(jīng)深入到社會經(jīng)濟的各個領(lǐng)域,并為實體經(jīng)濟的發(fā)展做出突出貢獻。下游應(yīng)用技術(shù)路線的發(fā)展,就是為了使AI智能技術(shù)與場景進行有效結(jié)合,從而在實際應(yīng)用領(lǐng)域發(fā)揮重要作用。我國目前的應(yīng)用技術(shù)終端產(chǎn)品十分豐富,較多AI企業(yè)所選擇的技術(shù)路線也都是在這一方向,包括金融、移動互聯(lián)網(wǎng)、教育、安防及醫(yī)療等多個領(lǐng)域。簡而言之,AI通過模型訓(xùn)練與優(yōu)化、數(shù)據(jù)處理、持續(xù)學(xué)習(xí)與改進、部署與應(yīng)用等,實現(xiàn)對語音、圖像、視頻等信息的識別與處理,以此提高智能穿戴設(shè)備、智能安防設(shè)備、智能醫(yī)療設(shè)備、自動駕駛汽車及智能家居設(shè)備產(chǎn)品的智能化水平,提升用戶使用舒適體驗等功能。在此基礎(chǔ)上,根據(jù)體力與腦力工作形式不同,AI的應(yīng)用還分為替代型體力應(yīng)用、替代型腦力應(yīng)用、輔助型腦力應(yīng)用以及輔助型體力應(yīng)用4種類型,如圖1所示。
圖1 AI的應(yīng)用
就目前發(fā)展來看,輔助型腦力應(yīng)用被更多的行業(yè)所采納,如安保監(jiān)控應(yīng)用、數(shù)據(jù)分析應(yīng)用、客戶關(guān)系管理應(yīng)用等,可以實現(xiàn)工作效率提高、工作覆蓋面擴大、專業(yè)知識積累等目標。如在公共交通領(lǐng)域,使用面部識別系統(tǒng)對可疑人員進行篩查,可以提升破案效率。未來的應(yīng)用技術(shù)路線,將會成為越來越多企業(yè)和個人選擇的發(fā)展方向,因為這一層面的AI產(chǎn)品可以更具體地為人類的生產(chǎn)生活提供幫助。
從社會產(chǎn)業(yè)發(fā)展角度來看,各企業(yè)所選擇的不同技術(shù)路線具有各自的特征,也衍生出以某種技術(shù)形式為核心的經(jīng)營企業(yè)。
通過創(chuàng)新創(chuàng)造中央處理器(Central Processing Unit,CPU),助力傳統(tǒng)企業(yè)擁抱AI,是當前AI技術(shù)發(fā)展路線的重要一環(huán)。CPU是計算機的核心部件,負責執(zhí)行計算機程序中的指令,進行算術(shù)、邏輯、控制和輸入/輸出等操作。利用CPU,人們可以進行AI學(xué)術(shù)研究。一些AI企業(yè)在創(chuàng)新創(chuàng)造過程中,還嘗試利用CPU技術(shù)構(gòu)建AI平臺、開拓AI生態(tài)等。以CPU技術(shù)為核心開發(fā)的典型代表之一是美國的英特爾公司。它是一家以CPU處理器的研究開發(fā)為主導(dǎo)的企業(yè),也是全球最大的個人計算機零件和CPU制造商。該企業(yè)的制造和集成工藝一直都是其傳統(tǒng)優(yōu)勢,但也存在不足,即CPU通用架構(gòu)設(shè)計的運行效率受限。就目前的發(fā)展來看,CPU處理器在機器學(xué)習(xí)領(lǐng)域的計算已經(jīng)明顯減少,卻不能被完全替代。英特爾公司研發(fā)出的至強處理器系列產(chǎn)品可以完成深度學(xué)習(xí)算法。應(yīng)用企業(yè)可以根據(jù)自身的實際情況,選擇適合的CPU產(chǎn)品,以實現(xiàn)成本與性能兼顧的目的。由此可見,CPU技術(shù)路線仍然擁有廣闊的發(fā)展空間,并在應(yīng)用領(lǐng)域發(fā)揮不可替代的重要作用。
GPU是一種專門用于處理圖形和圖像計算的處理器,主要用于加速圖形渲染、圖像處理、計算機視覺和深度學(xué)習(xí)等任務(wù)。它是一種強大的計算設(shè)備,其功能主要是處理電腦系統(tǒng)中與圖形計算有關(guān)的工作,核心是多個流處理器。每個流處理器都具有完整的算術(shù)和邏輯單元,以及紋理單元和專門的光柵化器。鑒于是一種圖形處理器[3],GPU技術(shù)路線的典型代表是英偉達公司,目前同方AI服務(wù)器就使用了英偉達CPU技術(shù)路線的一些產(chǎn)品。以深度學(xué)習(xí)算法為主要內(nèi)容,英偉達公司研發(fā)出了Vo1t架構(gòu)GPU——NVIDIA TeslaV100 GPU計算卡。與CPU相比,GPU的技術(shù)任務(wù)是開展大規(guī)模并行運算,其運算速度更快。在功能方面,GPU主要用于圖像渲染與處理、計算機視覺等圖形計算任務(wù);在架構(gòu)方面,GPU通常具有大量的計算單元和超長的流水線,但缺乏復(fù)雜的控制邏輯和大型緩存;在并行性方面,GPU在處理大規(guī)模數(shù)據(jù)時具有比較強的并行計算能力,可以同時處理多個任務(wù)。與其他專用AI處理器芯片相比,GPU還具有價格上的優(yōu)勢。此外,GPU在功能上雖然沒有CPU更全面,但其執(zhí)行的速度要比CPU快很多。因此,GPU更適合應(yīng)用在加密貨幣挖掘等領(lǐng)域,可以實現(xiàn)更優(yōu)的成本效益。
數(shù)字信號處理器(Digital Signal Process,DSP)是一種適用各類數(shù)字信號處理運算的微處理器。在傳統(tǒng)集成電路技術(shù)和數(shù)字化器件發(fā)展水平的制約下,數(shù)字信號處理只能進行理論概念的講授與仿真。隨著科學(xué)技術(shù)的進步,DSP發(fā)展至今,已經(jīng)具有多種功能,如圖像和音頻處理、系統(tǒng)控制、數(shù)字信號處理、信號分析以及模擬信號處理等[4]。DSP具有多元化硬件資源、不斷完善的并行結(jié)構(gòu)、強大的指令系統(tǒng)以及高速且精準的數(shù)據(jù)處理能力,被廣泛應(yīng)用于通信、航空航天、機器人研制及工業(yè)自動化等眾多領(lǐng)域。因此,DSP技術(shù)路線不僅是當前,更是未來不可或缺的重要研究路線。
ASIC是相對于通用集成電路而言的一類集成電路,指針對某一應(yīng)用領(lǐng)域或某一客戶的特殊要求而設(shè)計的集成電路,特點是品種多、批量小、單片功能強。該技術(shù)路線的從業(yè)企業(yè)以谷歌公司為典型代表。谷歌公司推出的TPU3.0是一款專用邏輯電路,配合TensorFlow框架進行適用。目前,這款智能化產(chǎn)品是該公司的專用產(chǎn)品,還沒有實現(xiàn)市場化。隨著AI科技的不斷進步,ASIC技術(shù)路線將成為眾多企業(yè)的青睞對象,在未來的各行業(yè)發(fā)展中擁有廣闊的應(yīng)用前景。
基于對3條AI技術(shù)路線的洞察可以了解到,弱AI將在未來很長時間內(nèi)作為輔助人類生產(chǎn)生活的主要形式而存在。而AI未來究竟能達到怎樣的水平,很多相關(guān)專家也無法給出準確答案。目前,AI的高級技術(shù)形式仍然處于概念化階段,還有待長期研究與開發(fā)。探究人與AI的關(guān)系,將是未來AI發(fā)展過程中需要面臨的重點問題之一。因此,探究人機傳播新范式,對人與社會的全面健康發(fā)展具有重要意義。
首先,要充分理解什么是人機傳播。從某種意義上來說,人機傳播與人際傳播十分相似。人機傳播的頻率越來越高。在很多時候,人們在人機傳播上所花費的時間要比人際傳播更長,因為人們的日常生活已經(jīng)完全離不開網(wǎng)絡(luò),如線上溝通、網(wǎng)購、支付及轉(zhuǎn)賬等。但是,歸根結(jié)底,人機傳播與人際傳播是有差別的,機器無法模擬人的情感,人際傳播會更真誠、更富有情感。而且,人際溝通的目標性更強,而人機溝通則不然。但隨著AI水平的提高,人機傳播會越來越流暢,人與機器的關(guān)系也會變得越來越和諧。
其次,網(wǎng)絡(luò)通信、信息技術(shù)等促進了人機傳播的發(fā)展。人與機器之所以能夠?qū)崿F(xiàn)對話、交流和互動,主要是因為算法對數(shù)據(jù)的精準推斷,也就是說,算法是人機傳播、溝通的樞紐。在這一過程中,機器作為“媒介”輔助人類交流,機器還成為動態(tài)參與傳播的主體。人機傳播的特點還體現(xiàn)在機器的獨特性與特殊上。目前,機器雖不具備人類的某些特質(zhì),如人類的自我意識、通用智能和生活常識,但機器在邏輯、運算和記憶等思維方面優(yōu)于人類[5]。人機傳播的核心在于機器與人之間的雙向、動態(tài)、相互作用的交流過程。AI借助精妙的算法,可以生成個人用戶偏好重要信息,以此刻畫出媒介用戶的個性化喜好內(nèi)容。在傳播過程中,由算法為用戶自動過濾掉相關(guān)信息內(nèi)容,用戶也可根據(jù)自己的興趣進行主動定制。算法還具有加速人機傳播情感連接的作用。如直播帶貨,以情緒激發(fā)為傳媒黏合劑而生成的新型商媒活動,以算法關(guān)聯(lián)商品判斷、用戶偏好分析、品類分析等,可以更好地為用戶提供更貼心的服務(wù),使用戶的圈層屬性得到增強[6]。
最后,對人機傳播結(jié)果予以探究。在萬物互聯(lián)背景下,從人類個體角度來看,人機傳播可以劃分為主動與被動兩種形式。在全球物聯(lián)但隱私意識不足的情況下,大多數(shù)人類個體都會經(jīng)歷一種后知后覺的不適體驗,即不知不覺地就為機器提供了大量的分析數(shù)據(jù)。如當前的大數(shù)據(jù)推送功能,人們在體驗到便利性的同時,也會擔心會泄露隱私。由此可見,人機傳播在個體無意識的情況下,對個體的深度剖析可能帶來一定的不良后果。因此,如何突出人的主體性,保證人與機器交互過程中的主動權(quán),將是未來AI發(fā)展過程中必須予以重視的重點課題。
對AI技術(shù)路線的有效洞察,能有效促進社會各行業(yè)實現(xiàn)協(xié)同發(fā)展、互利互惠的發(fā)展目標,對確定AI發(fā)展方向有著決定性意義。在此基礎(chǔ)上,還能夠有效促進人機傳播新范式的研究與發(fā)展,對我國新型科學(xué)技術(shù)的全面振興具有重要意義。