朱曉慶
(長江工程職業(yè)技術學院 湖北 武漢 430212)
新媒體的產(chǎn)生和蓬勃發(fā)展為新聞的傳播奠定了傳輸基礎,從狹義角度來說,新聞就是指利用簡單明了的語言對實時發(fā)生事件進行語言描述的一種文體,新聞大數(shù)據(jù)傳播的根本目的是讓社會大眾了解國內(nèi)外發(fā)生的某些事件,其傳播速度和傳播途徑均與其傳播特征有著密切聯(lián)系[1]。新聞大數(shù)據(jù)的傳輸速度和社會的發(fā)展速度之間存在聯(lián)系,隨著科學技術水平的不斷提高,新聞大數(shù)據(jù)的傳播模式、路徑、載體、方式方法等都發(fā)生了翻天覆地的變化[2]。新聞大數(shù)據(jù)的傳播特征主要包括新聞表現(xiàn)形式、文體表述方法、大數(shù)據(jù)的狀態(tài)特征3個方面的內(nèi)容,對于不同類型的新聞大數(shù)據(jù),與之相對應的傳播特征也各不相同,只有新聞大數(shù)據(jù)與其傳播特征二者吻合,才能將新聞大數(shù)據(jù)的傳播效果充分發(fā)揮出來[3]。
傳統(tǒng)化的新聞大數(shù)據(jù)傳播特征挖掘系統(tǒng)始終存在特征挖掘相對滯后的問題,并且現(xiàn)有的技術手段無法對系統(tǒng)進行有效改善和升級,因此,為了有效提高新聞大數(shù)據(jù)傳播的速度,本文引入當前先進的技術手段——人工智能技術作為支持動力,對新聞大數(shù)據(jù)傳播特征及挖掘系統(tǒng)進行設計實現(xiàn)[4]。本文主要對系統(tǒng)的硬件部分和軟件部分分別進行了設計,通過分析和實驗對比測試顯示,研究設計的基于人工智能的挖掘系統(tǒng)具有較高的挖掘效率和準確率,性能較好,能夠滿足使用要求[5-6]。
基于人工智能的新聞大數(shù)據(jù)傳播特征及挖掘系統(tǒng)硬件區(qū)域組件設計示意圖見圖1。
本文設計的系統(tǒng)硬件結(jié)構中,采用型號為GJ-HD、數(shù)據(jù)通信信道為單端16路的數(shù)據(jù)采集器,對于不同類型的新聞大數(shù)據(jù),數(shù)據(jù)采集器的工作頻率可以進行自動化調(diào)試,其中,最高振幅可以高達40 M。同時,為了有效提高數(shù)據(jù)采集單元內(nèi)各個采集器的兼容性,采用運行速度較快,且具有較強保密性的RAM和FIFO兩種類型的緩沖磁盤。
本文設計系統(tǒng)的最終目的和核心問題就是實現(xiàn)新聞大數(shù)據(jù)傳播特征的提取和挖掘。數(shù)據(jù)分析單元設計至關重要,本文選擇i9系列的數(shù)據(jù)分析器作為系統(tǒng)數(shù)據(jù)分析單元的主要組件,該組件的運行內(nèi)存為128 G,根據(jù)系統(tǒng)實際運行需要,還需要另外設置4個移動接口作為備用。
系統(tǒng)數(shù)據(jù)分析單元內(nèi)的各個組件采用的是USB3.0接口協(xié)議,其運行速率為650 kB/s,能夠?qū)崿F(xiàn)新聞傳輸大數(shù)據(jù)特征的穩(wěn)定傳輸工作。組件的lan通道和CAN通道數(shù)量分別為1和2位,支持candf運行技術,對于新聞傳輸大數(shù)據(jù)文本的傳輸速率更是達到了1萬幀/s,其工作效率較高,完全能夠滿足系統(tǒng)的設計要求。各個組件的工作電壓和電流分別為12 V和5 A,為了有效提高各個組件的抗干擾性能,組件外殼全部采用塑料包裝。本文采用的數(shù)據(jù)分析組件擁有以下優(yōu)點:一是能夠根據(jù)實際工作環(huán)境調(diào)整工作電壓;二是組件能夠?qū)⑿侣劥髷?shù)據(jù)傳播特征分析結(jié)果以Lan加密格式輸出,能夠大大提高數(shù)據(jù)的安全性。
該組件是整個系統(tǒng)硬件部分能夠順利運行的核心,其主要工作任務就是驅(qū)動系統(tǒng)內(nèi)的所有其他組件,同時對各個組件的運行狀態(tài)進行實時控制,一旦發(fā)現(xiàn)系統(tǒng)組件發(fā)生異常運行情況,中央集控單元就會啟動內(nèi)部分析功能,對故障點進行查找,及時處理和排障。該組件采用MP/MC和DCNF互相集成的接口,組件輸出的所有指令都是64位數(shù)據(jù)條,組件的控制是通過信號波形式實現(xiàn)的,為了提高整個設計系統(tǒng)的運行速度和故障排查恢復效率,中央集控單元還需要具備接收來自其他組件信息讀寫申請的功能。中央集控單元的有效工作電壓為3~6 V,組件內(nèi)部實現(xiàn)了轉(zhuǎn)換電路和控制電路的完全集成,能夠?qū)崿F(xiàn)Flash靜態(tài)控制,同時防止組件內(nèi)部電力信息的自動篡改,能夠有效降低組件之間電路連接的復雜程度和工程量,實現(xiàn)系統(tǒng)運行速度的大幅度提高。
設計傳感器單元的意義在于連通整個系統(tǒng)內(nèi)部所有單元組件的發(fā)送信號和指令,實現(xiàn)新聞大數(shù)據(jù)傳播特征在硬件區(qū)域的快速、有效集成。本文選取的傳感器組件靈敏度和最大輸出幀率分別為68D和35 Hz,同時支持多種外接接口,包括Lan、USB、RS232等,以確保傳感器單元各個組件的應用范圍。圖2給出了傳感器單元內(nèi)部電路連接示意圖。
從圖2可以看出,傳感器單元內(nèi)部組件均為全固態(tài)結(jié)構,具有較強的抗干擾性能,同時還能大大提高傳感器的傳輸速度。此外,單元內(nèi)各個組件支持N/S雙級轉(zhuǎn)換檢測,采用CAN2.0通信協(xié)議,單個組件最大消耗電流參數(shù)不超過80 mA,啟動響應延時僅為5 ms,能夠在-40~40 ℃的超大環(huán)境范圍內(nèi)保持正常運行,且輸出阻抗不高于500 Ω,能夠大大緩解傳感器的輸出負載,有效提高系統(tǒng)的運行效率,延長系統(tǒng)內(nèi)電池的使用壽命。由于各個組件的介質(zhì)強度均小于100 μA,獨立線性度為0.05%,還能夠大幅度降低新聞大數(shù)據(jù)傳播的誤碼率。
人工智能技術的本質(zhì)是對各種組件的大規(guī)模集成,賦予其人腦思維,使其即使脫離人腦控制仍然能夠做出與人類行為相似的反應或行為,其主要作用是模擬和擴展人類行為,該項技術近年來被廣泛應用于各個行業(yè)領域。本文采用該項技術不僅能夠大幅度提高新聞大數(shù)據(jù)傳播特征的提取和挖掘深度,而且由于新聞大數(shù)據(jù)本身具有特殊性,還能夠利用人工智能網(wǎng)絡傳輸協(xié)議有效提高新聞大數(shù)據(jù)傳播的安全性,防止新聞大數(shù)據(jù)泄露問題的產(chǎn)生。
基于人工智能的網(wǎng)絡傳輸協(xié)調(diào)不僅具有正常的網(wǎng)絡通信協(xié)議功能,還具有正常的網(wǎng)絡通信協(xié)議不具備的特殊功能,即對傳輸?shù)男侣劥髷?shù)據(jù)文本進行加密處理,同時還能夠大大提高系統(tǒng)運行效率,便于后續(xù)的新聞大數(shù)據(jù)特征提取和深度挖掘。該傳輸協(xié)議的本質(zhì)是網(wǎng)絡藍本,將正常的網(wǎng)絡協(xié)議利用離散傅里葉規(guī)則算法進行二維處理之后即可實現(xiàn)人工智能協(xié)議特殊屬性的激活和對接。根據(jù)需要分析和處理的數(shù)據(jù)信號,將其接入系統(tǒng)中,使得系統(tǒng)數(shù)據(jù)載波與隨機碼同步,此時人工智能協(xié)議的頻域也會隨之產(chǎn)生波動,波動幅度與人工智能協(xié)議對接屬性的切合函數(shù)計算公式如下:
上述公式中,n代表當前人工智能網(wǎng)絡協(xié)議信號數(shù)據(jù)的測量關系指數(shù);r代表當前新聞大數(shù)據(jù)傳播信號可執(zhí)行性定義域;代表當前提取新聞大數(shù)據(jù)傳播特征頻域的測量關系值;x(r)代表新聞大數(shù)據(jù)傳播特征控制端的數(shù)據(jù)序列;y(n)代表系統(tǒng)中央集控單元新聞大數(shù)據(jù)傳播信號接收序列;ρ代表人工智能網(wǎng)絡協(xié)議特殊屬性激活過程中的信號轉(zhuǎn)碼阻隔值。根據(jù)上述計算即可實現(xiàn)對人工智能網(wǎng)絡協(xié)議的合理調(diào)配。
基于人工智能網(wǎng)絡協(xié)議的合理調(diào)配,為了提高新聞大數(shù)據(jù)傳播特征提取的準確性,利用人工智能平臺,對需要提取和挖掘的新聞大數(shù)據(jù)傳播特征進行集中處理,對人工智能平臺數(shù)字信息進行集中整合,將平臺中的新聞大數(shù)據(jù)傳播特征集中存儲到系統(tǒng)數(shù)據(jù)庫中,并根據(jù)數(shù)據(jù)量的大小對系統(tǒng)數(shù)據(jù)庫的存儲空間狀態(tài)進行調(diào)整,以實現(xiàn)系統(tǒng)數(shù)據(jù)庫空間容量的智能擴展。在處理和計算各種新聞大數(shù)據(jù)傳播特征數(shù)據(jù)過程中,要對數(shù)據(jù)之間的內(nèi)在聯(lián)系進行分析,并構建數(shù)據(jù)聯(lián)系搜索圖示,以便于相關數(shù)據(jù)的查找。
基于上述設計的系統(tǒng)軟件部分結(jié)構,對系統(tǒng)的具體操作流程進行了設計和實現(xiàn)。
(1)對系統(tǒng)進行初始化設置,系統(tǒng)中央集控單元驅(qū)動硬件部分的所有組件,數(shù)據(jù)采集單元采集需要挖掘的新聞大數(shù)據(jù)包,并且對采集獲得的新聞大數(shù)據(jù)包進行信號降噪處理,將最終的處理結(jié)果輸入到數(shù)據(jù)分析單元,實現(xiàn)新聞大數(shù)據(jù)向量集合。
(2)在系統(tǒng)數(shù)據(jù)分析單元構建新聞大數(shù)據(jù)傳播特征模型,將新聞大數(shù)據(jù)傳播特征和傳播導向進行有效提取,并將提取結(jié)果集合成為一個整體數(shù)據(jù)包,存儲在系統(tǒng)數(shù)據(jù)庫內(nèi)。
(3)將存儲在系統(tǒng)數(shù)據(jù)庫內(nèi)的數(shù)據(jù)包發(fā)送給人工智能網(wǎng)絡協(xié)議關聯(lián)的各個數(shù)據(jù)節(jié)點,對新聞大數(shù)據(jù)傳播特征進行關聯(lián)計算,同樣利用該協(xié)議將關聯(lián)計算結(jié)果傳輸給系統(tǒng)中央集控單元,至此即完成了新聞大數(shù)據(jù)傳播特征的挖掘工作,如圖3給出了具體挖掘流程。
上述分析實現(xiàn)了基于人工智能的新聞大數(shù)據(jù)傳播特征及挖掘系統(tǒng)設計,為了進一步檢驗設計的系統(tǒng)能否滿足實際需要,運行參數(shù)是否符合相應標準,本文對其進行了實驗測試和檢驗。實驗選擇傳統(tǒng)的基于區(qū)塊鏈技術的挖掘系統(tǒng)與本文設計的系統(tǒng)進行對比分析,同步完成測試,確保系統(tǒng)檢驗的公平性。
本次實驗的檢驗標準是分析不同挖掘系統(tǒng)對于相同內(nèi)容的新聞大數(shù)據(jù)特征提取響應速度和挖掘準確率,得出最終測試結(jié)果。實驗測試正式開始之前要準備3份1萬字的新聞大數(shù)據(jù)包作為預備文本,并從中選擇一個作為本次測試采用的測試樣本。實驗中需要用到計算機和數(shù)據(jù)分析儀,在測試之前需要對設備儀器等進行精準度校對,避免出現(xiàn)較大誤差。選擇同一時間將測試文本分別輸入兩個不同系統(tǒng),由工作人員整理和記錄測試結(jié)果,分析實驗數(shù)據(jù),得出測試結(jié)果和相應結(jié)論。表1和圖4分別給出了系統(tǒng)挖掘時間和挖掘準確率對比測試結(jié)果。
表1 系統(tǒng)挖掘時間對比測試結(jié)果
(1)兩個對比挖掘系統(tǒng)中,最先提交新聞大數(shù)據(jù)包特征提取結(jié)果的是基于區(qū)塊鏈技術的挖掘系統(tǒng),最后提交提取結(jié)果的是本文設計的系統(tǒng)。
(2)經(jīng)過專業(yè)的計算機和數(shù)據(jù)分析儀器可知,本文設計的挖掘系統(tǒng)不存在新聞大數(shù)據(jù)傳播特征輸出延時問題,而基于區(qū)塊鏈技術的挖掘系統(tǒng)則明顯存在新聞大數(shù)據(jù)傳播特征輸出延時問題。
(3)本文設計的挖掘系統(tǒng)提取的新聞大數(shù)據(jù)傳播特征關鍵詞與真實關鍵詞的詞義基本一致,挖掘準確率較高,平均值最高達到了95%,而基于區(qū)塊鏈技術的挖掘系統(tǒng)提取的新聞大數(shù)據(jù)傳播特征關鍵詞與真實關鍵詞的詞義相差較遠,挖掘準確率較低,平均值最高僅為80%左右。
根據(jù)上述實驗對比測試結(jié)果可以看出,本文設計的挖掘系統(tǒng)不存在新聞大數(shù)據(jù)傳播特征輸出延時問題,且提取的新聞大數(shù)據(jù)傳播特征關鍵詞與真實關鍵詞的詞義基本一致,挖掘準確率高達95%,由此說明,本文設計的挖掘系統(tǒng)具有較高的挖掘效率和準確率,性能較好,能夠滿足使用要求,可以進行推廣應用。
本文設計的挖掘系統(tǒng)包括軟件和硬件兩個部分,其中硬件部分包括數(shù)據(jù)采集單元、數(shù)據(jù)分析單元、中央集控單元和傳感器單元,每個單元的組件性能都是高配,能夠配合軟件部分功能的正常使用。關于系統(tǒng)的軟件部分設計,要優(yōu)先考慮系統(tǒng)設計要求,引進先進的人工智能技術,并在此基礎上形成了新的網(wǎng)絡傳輸協(xié)議,大大提高了新聞大數(shù)據(jù)包的傳輸效率。