• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)標(biāo)準(zhǔn)化研究

      2023-07-06 12:42:10李書劍龐天楓楊泰波劉才學(xué)
      關(guān)鍵詞:編碼方式數(shù)據(jù)類型數(shù)據(jù)文件

      李書劍,龐天楓,楊泰波,劉才學(xué)

      (中國核動(dòng)力研究設(shè)計(jì)院,成都 610213)

      0 引言

      故障診斷是保障核電站安全、穩(wěn)定性運(yùn)行的重要環(huán)節(jié)。在反應(yīng)堆關(guān)鍵設(shè)備故障診斷專業(yè)領(lǐng)域,中國核動(dòng)力研究設(shè)計(jì)院自主設(shè)計(jì)、研發(fā)的相關(guān)產(chǎn)品種類豐富,并在核電市場(chǎng)具有較廣的覆蓋面,主要產(chǎn)品包括:1)松脫部件監(jiān)測(cè)系統(tǒng)(LPMS,loose part monitoring system),主要用于反應(yīng)堆一回路內(nèi)可能出現(xiàn)的松動(dòng)件、脫落件和遺留的金屬零件等的在線監(jiān)測(cè)[1];2)堆內(nèi)構(gòu)件振動(dòng)監(jiān)測(cè)系統(tǒng)(VMS,vibration monitoring system,),主要用于周期性監(jiān)測(cè)堆內(nèi)構(gòu)件的振動(dòng),防止堆芯吊籃壓緊彈簧過度松弛和支撐嚴(yán)重劣化[2];3)主管道和波動(dòng)管LBB(leak before break)泄漏監(jiān)測(cè)系統(tǒng),簡稱“LBB”,主要用于監(jiān)測(cè)反應(yīng)堆一回路主管道和波動(dòng)管早期破前泄漏[3];4)反應(yīng)堆冷卻劑泵監(jiān)測(cè)系統(tǒng)(CPMS,coolant pump monitoring system),主要用于主泵等旋轉(zhuǎn)機(jī)械狀態(tài)監(jiān)測(cè)與分析[4]。上述產(chǎn)品主要采集振動(dòng)、運(yùn)行工況等狀態(tài)數(shù)據(jù),采集到的數(shù)據(jù)統(tǒng)稱為 “反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)”。目前,上述產(chǎn)品已應(yīng)用于國內(nèi)46臺(tái)、海外4臺(tái)核電機(jī)組,并且建立了基于大數(shù)據(jù)和互聯(lián)網(wǎng)的反應(yīng)堆遠(yuǎn)程智能診斷平臺(tái)(PRID,platform of reactor remote intelligent diagnosis),每月收集超過10萬條監(jiān)測(cè)系統(tǒng)數(shù)據(jù),而PRID依靠這些數(shù)據(jù)進(jìn)行反應(yīng)堆關(guān)鍵設(shè)備的狀態(tài)分析、故障診斷及預(yù)警,已成功進(jìn)行了60余次故障告警[5]。

      由于不同核電機(jī)組的設(shè)備型號(hào)及結(jié)構(gòu),以及核電業(yè)主的實(shí)際需求存在較大差異,再加上軟硬件版本提升和技術(shù)更新?lián)Q代,上述產(chǎn)品應(yīng)用在不同核電機(jī)組的版本不盡相同,甚至同一機(jī)組在不同運(yùn)行周期的產(chǎn)品版本也可能存在差異,這直接導(dǎo)致了不同產(chǎn)品所產(chǎn)生的數(shù)據(jù)偏離了預(yù)先制定的統(tǒng)一標(biāo)準(zhǔn)規(guī)范,數(shù)據(jù)資源出現(xiàn) “熵增”現(xiàn)象。另外,隨著數(shù)據(jù)的積累量越來越大,數(shù)據(jù)的利用和管理效率也逐漸降低。而在數(shù)據(jù)使用后端,依賴于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)在設(shè)備故障診斷領(lǐng)域的深入應(yīng)用也對(duì)數(shù)據(jù)質(zhì)量提出了更高的要求[6-7]。

      通過對(duì)核電故障診斷產(chǎn)品所采集的狀態(tài)數(shù)據(jù)資源進(jìn)行全面梳理和細(xì)致分析,總結(jié)得到了目前的資源現(xiàn)狀,主要包括:

      1)文件格式多樣:包括“.dat”、“.tdms”、“.csv”等7種文件格式;

      2)解析規(guī)則眾多:海內(nèi)外50個(gè)核電機(jī)組產(chǎn)品所產(chǎn)生的數(shù)據(jù)對(duì)應(yīng)了20種不同的解析規(guī)則;

      3)數(shù)據(jù)解析復(fù)雜:數(shù)據(jù)沒有統(tǒng)一的解析規(guī)范,且編碼方式、數(shù)據(jù)類型等存在差異。

      上述現(xiàn)狀導(dǎo)致了PRID在進(jìn)行數(shù)據(jù)解析時(shí)耗時(shí)較長以及數(shù)據(jù)解析容易出錯(cuò),十分不利于數(shù)據(jù)的統(tǒng)一管理和后續(xù)產(chǎn)品的開發(fā)與迭代。

      本文將首先對(duì)核電故障診斷產(chǎn)品所采集的狀態(tài)數(shù)據(jù)資源現(xiàn)狀進(jìn)行全面梳理和細(xì)致分析,然后基于數(shù)據(jù)標(biāo)準(zhǔn)化的相關(guān)概念,提出反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)標(biāo)準(zhǔn)化的思路與方法;在此基礎(chǔ)上,結(jié)合實(shí)際數(shù)據(jù)情況,進(jìn)行工程應(yīng)用實(shí)踐,并評(píng)估數(shù)據(jù)標(biāo)準(zhǔn)化的效果,最后進(jìn)行總結(jié)并提出思考,為未來核電市場(chǎng)產(chǎn)品供貨、遠(yuǎn)程智能診斷平臺(tái)拓展、健康管理平臺(tái)開發(fā)等提供數(shù)據(jù)側(cè)相關(guān)參考。

      1 反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)資源現(xiàn)狀分析

      1.1 整體情況

      核電故障診斷產(chǎn)品所采集的狀態(tài)數(shù)據(jù)資源主要來源于四大類:LPMS產(chǎn)品應(yīng)用于50個(gè)核電機(jī)組,VMS產(chǎn)品應(yīng)用于26個(gè)核電機(jī)組,CPMS產(chǎn)品應(yīng)用于5個(gè)機(jī)組,而LBB產(chǎn)品應(yīng)用于2個(gè)機(jī)組。在產(chǎn)品前端,數(shù)據(jù)采集主要通過基于LabVIEW 軟件的程序?qū)崿F(xiàn),LabVIEW 是一款圖形化的軟件開發(fā)工具[8],在數(shù)據(jù)采集、硬件控制、數(shù)據(jù)交互等方面具有很大的優(yōu)勢(shì)[9]。通過LabVIEW 采集得到的數(shù)據(jù)文件定期傳遞至PRID,存儲(chǔ)在專門的數(shù)據(jù)服務(wù)器中,并進(jìn)行后續(xù)的處理與分析工作。

      通過對(duì)數(shù)據(jù)資源進(jìn)行全面梳理和細(xì)致分析,發(fā)現(xiàn)目前在數(shù)據(jù)的采集、讀取、存儲(chǔ)、使用等方面存在較多不統(tǒng)一、不規(guī)范等問題,具體表現(xiàn)在文件格式、文件命名、文件編碼方式、文件數(shù)據(jù)類型以及文件解析規(guī)則等方面,本節(jié)將依次進(jìn)行分析。

      1.2 文件格式不統(tǒng)一

      文件格式是指數(shù)據(jù)在計(jì)算機(jī)中存儲(chǔ)而使用的對(duì)信息的特殊編碼方式,每一類信息都可以有一種或多種文件格式保存在電腦存儲(chǔ)中,每一種文件格式通常會(huì)有一種或多種擴(kuò)展名(文件后綴)用于識(shí)別,不同的擴(kuò)展名對(duì)應(yīng)不同的打開和使用方式。

      根據(jù)梳理,目前反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)資源文件格式種類多樣,具體如表1所示,其中,產(chǎn)品數(shù)據(jù)包括7種格式,其中大部分為 “.dat”格式,“.dat”格式文件通過二進(jìn)制進(jìn)行讀寫,具有較快的讀寫速度和較小的文件體積,適合高頻數(shù)據(jù)采集以及大批量數(shù)據(jù)存儲(chǔ)[10]。另外少量其他格式也為二進(jìn)制文件(如 “.cbv”、“.DAN”等),“.tdms”與“.csv”格式需要輔助軟件進(jìn)行讀取。

      表1 數(shù)據(jù)文件格式

      多文件格式存在的數(shù)據(jù)管理問題主要包括:1)文件格式種類較多,若進(jìn)行統(tǒng)一管理,則需要對(duì)多種格式進(jìn)行適配,增加了軟件的復(fù)雜程度;2)數(shù)據(jù)隔離程度高,不同類型格式文件較難互相轉(zhuǎn)化。

      1.3 數(shù)據(jù)文件命名方式多樣化

      文件名是數(shù)據(jù)文件的標(biāo)識(shí)符,在同一個(gè)地址下具有唯一性。目前故障診斷產(chǎn)品數(shù)據(jù)文件命名方式種類多樣,具體情況如表2所示。由表可知,大部分文件的文件名只包含采集日期、時(shí)間信息,部分文件將傳感器采集通道名作為文件名(如 “VRA01”),部分文件名中存在空格,容易影響文件名讀取。

      表2 數(shù)據(jù)文件命名方式

      隨著數(shù)據(jù)積累,為便于規(guī)范化管理和查詢,應(yīng)當(dāng)具備通過文件名初步識(shí)別該數(shù)據(jù)文件所屬電站、機(jī)組、類型、采集數(shù)據(jù)時(shí)間等關(guān)鍵信息,其中福清3號(hào)機(jī)組CPMS數(shù)據(jù)文件名較為規(guī)范(FQ03ZB20210820161117000.dat),能夠有效通過文件名識(shí)別關(guān)鍵信息,但是該文件名分隔較少,難以閱讀。

      1.4 數(shù)據(jù)文件編碼方式不統(tǒng)一

      編碼是信息從一種形式或格式轉(zhuǎn)換為另一種形式的過程,使用預(yù)先規(guī)定的方法將漢字、數(shù)字或其他對(duì)象編成數(shù)碼,計(jì)算機(jī)在處理文件時(shí),將可以正常閱讀或使用的十進(jìn)制數(shù)字、英文字母、漢字等轉(zhuǎn)化為二進(jìn)制編碼。對(duì)故障診斷產(chǎn)品的數(shù)據(jù)文件進(jìn)行讀取分析時(shí)發(fā)現(xiàn),數(shù)據(jù)文件存在編、解碼方式的不統(tǒng)一。

      二進(jìn)制數(shù)據(jù)文件在計(jì)算機(jī)中進(jìn)行編碼存儲(chǔ)時(shí)分為大端編碼(big-endian,亦稱高尾端)和小端編碼(little-endian,亦稱低尾端)兩種模式,大端編碼將低位數(shù)據(jù)存放在高位地址,小端編碼將低位數(shù)據(jù)存放在低位地址[12]。使用大端解碼的方式讀取小端編碼的數(shù)據(jù)文件,將會(huì)出現(xiàn)解析錯(cuò)誤。在現(xiàn)有的數(shù)據(jù)文件中,大部分?jǐn)?shù)據(jù)文件都采用大端編碼的模式,少部分采用小端編碼的模式。除大、小端編碼方式以外,數(shù)據(jù)文件中還存在字符的編碼問題。目前數(shù)據(jù)資源中存在數(shù)字字符(如 “05”)、英文字符(如機(jī)組簡標(biāo)“HYH”)、特殊字符(如 “/”)和中文字符(如 “正常”),其中,數(shù)字、英文、特殊字符采用ASCII編碼方式[13],中文字符采用GBK 規(guī)范[14]。

      文件編碼方式的不統(tǒng)一導(dǎo)致在文件讀取時(shí)必須事先確定文件編碼規(guī)則,否則將導(dǎo)致數(shù)據(jù)解析出錯(cuò)。

      1.5 文件數(shù)據(jù)類型多樣化

      數(shù)據(jù)類型涉及到數(shù)據(jù)文件所存儲(chǔ)的具體內(nèi)容,根據(jù)針對(duì)上述所有類型數(shù)據(jù)文件的分析,可以總結(jié)得到目前數(shù)據(jù)資源所包含的12種數(shù)據(jù)類型,如表3所示。在目前已有的數(shù)據(jù)資源中,使用最多的數(shù)據(jù)類型是單精度浮點(diǎn)型(single)、短整型(short)和整型(int8),另外,“結(jié)構(gòu)型”數(shù)據(jù)僅存在于“.tdms”格式文件中。

      表3 數(shù)據(jù)類型

      1.6 文件解析規(guī)則復(fù)雜

      由于在產(chǎn)品研發(fā)階段考慮到數(shù)據(jù)文件的高速采集和大量存儲(chǔ)等情況,大部分產(chǎn)品的數(shù)采系統(tǒng)將數(shù)據(jù)以二進(jìn)制形式存儲(chǔ),這就導(dǎo)致了數(shù)據(jù)文件不便于直接閱讀,必須通過數(shù)據(jù)解析的方式將二進(jìn)制數(shù)據(jù)轉(zhuǎn)換成十進(jìn)制數(shù)據(jù)。

      數(shù)據(jù)解析規(guī)則是將二進(jìn)制數(shù)據(jù)轉(zhuǎn)化為可供正常閱讀的十進(jìn)制數(shù)據(jù)的關(guān)鍵,缺少數(shù)據(jù)規(guī)則將只能通過按位嘗試等“硬破解”方法進(jìn)行數(shù)據(jù)讀取(如早年國外產(chǎn)品服務(wù)機(jī)構(gòu)提供的數(shù)據(jù)),當(dāng)遇到數(shù)據(jù)存在加密等情況時(shí),沒有解析規(guī)則將永遠(yuǎn)無法提取出有效數(shù)據(jù)。目前,數(shù)據(jù)解析規(guī)則復(fù)雜是反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)資源中最為突出的問題,通過梳理,故障診斷產(chǎn)品數(shù)據(jù)資源目前具有20余項(xiàng)解析規(guī)則,如表4所示。

      表4 數(shù)據(jù)解析規(guī)則

      2 數(shù)據(jù)標(biāo)準(zhǔn)化的思路與方法

      為解決數(shù)據(jù)資源現(xiàn)狀中存在的問題,考慮應(yīng)用數(shù)據(jù)標(biāo)準(zhǔn)化的相關(guān)方法,數(shù)據(jù)標(biāo)準(zhǔn)化用于解決數(shù)據(jù)不規(guī)范、不統(tǒng)一等問題,也稱為標(biāo)準(zhǔn)化數(shù)據(jù)治理,包括標(biāo)準(zhǔn)定義、標(biāo)準(zhǔn)發(fā)布、標(biāo)準(zhǔn)維護(hù)等功能。數(shù)據(jù)標(biāo)準(zhǔn)化的目的在于盡可能對(duì)處于相對(duì)混亂狀態(tài)的數(shù)據(jù)資源實(shí)現(xiàn)規(guī)范化管理,最大程度提升數(shù)據(jù)的使用便利程度和使用效率,為后續(xù)挖掘數(shù)據(jù)價(jià)值奠定基礎(chǔ)[15]。針對(duì)核電故障診斷產(chǎn)品所采集的狀態(tài)數(shù)據(jù),數(shù)據(jù)標(biāo)準(zhǔn)化應(yīng)當(dāng)按照數(shù)據(jù)類型統(tǒng)一、解析規(guī)則少、解析快速方便、參數(shù)標(biāo)準(zhǔn)化度高、文件空間利用率高、容錯(cuò)性強(qiáng)、可移植性強(qiáng)、可擴(kuò)展性強(qiáng)等原則進(jìn)行設(shè)計(jì),但在實(shí)際執(zhí)行過程中會(huì)遇到較多問題,需要根據(jù)實(shí)際情況進(jìn)行調(diào)整,數(shù)據(jù)標(biāo)準(zhǔn)化一旦執(zhí)行將禁止輕易更改,因此需要對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化方法進(jìn)行充分測(cè)試[16]。對(duì)反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化將有助于:

      1)針對(duì)存量數(shù)據(jù):對(duì)當(dāng)前存量的數(shù)據(jù)資源,進(jìn)行規(guī)范化整理,使數(shù)據(jù)便于調(diào)取和使用;

      2)針對(duì)增量數(shù)據(jù):對(duì)未來增量的數(shù)據(jù)資源,數(shù)據(jù)產(chǎn)生和存儲(chǔ)按照標(biāo)準(zhǔn)化執(zhí)行,使數(shù)據(jù)統(tǒng)一。

      本文提出的數(shù)據(jù)標(biāo)準(zhǔn)化思路如圖1所示,主要流程即對(duì)照數(shù)據(jù)資源現(xiàn)狀中存在的問題,進(jìn)行標(biāo)準(zhǔn)化規(guī)范的定義與發(fā)布,通過標(biāo)準(zhǔn)化規(guī)范的約束,對(duì)原始較為混亂的數(shù)據(jù)資源進(jìn)行強(qiáng)制化、規(guī)范化管理,最后形成完整的數(shù)據(jù)標(biāo)準(zhǔn)化流程體系。本文主要根據(jù)上述思路,從文件格式、文件命名、文件編碼方式、文件數(shù)據(jù)類型、文件解析規(guī)則、數(shù)據(jù)存儲(chǔ)與讀取等方面入手開展數(shù)據(jù)標(biāo)準(zhǔn)化的實(shí)踐。

      圖1 數(shù)據(jù)標(biāo)準(zhǔn)化的流程

      3 數(shù)據(jù)標(biāo)準(zhǔn)化的實(shí)踐與效果

      3.1 文件格式標(biāo)準(zhǔn)化

      經(jīng)過對(duì)現(xiàn)有數(shù)據(jù)資源的梳理,以及查閱相關(guān)資料,包括對(duì)特殊格式數(shù)據(jù)(如 “.tdms”)進(jìn)行調(diào)研,結(jié)合目前狀態(tài)數(shù)據(jù)文件的實(shí)際情況(以 “.dat”數(shù)據(jù)格式為主),擬采用“.dat”文件格式作為數(shù)據(jù)存儲(chǔ)文件格式。

      使用“.dat”格式的主要優(yōu)點(diǎn)包括:

      1)使用便利度高:與現(xiàn)有數(shù)據(jù)、各類系統(tǒng)軟件適配,現(xiàn)有的LabVIEW 數(shù)據(jù)讀取、分析軟件可以照常使用,使用方便簡單,非標(biāo)準(zhǔn)化“.dat”數(shù)據(jù)文件格式可以較為簡單地轉(zhuǎn)化為標(biāo)準(zhǔn)化“.dat”數(shù)據(jù);

      2)軟件適配度高:“.dat”文件格式采用二進(jìn)制方式存儲(chǔ)數(shù)據(jù),占用內(nèi)存小,編碼方式簡單,可以使用任何軟件進(jìn)行讀取,適用于LabVIEW、C、Java、Python、MATLAB等眾多編程語言,不存在知識(shí)產(chǎn)權(quán)限制;

      3)數(shù)據(jù)安全性高:可以通過適當(dāng)?shù)募用芊绞綄?duì) “.dat”中的二進(jìn)制數(shù)據(jù)進(jìn)行加密,提高數(shù)據(jù)的安全性[17]。

      目前,使用“.dat”格式存在以下問題:

      (1)高度依賴于解析規(guī)則的準(zhǔn)確性:解析規(guī)則出現(xiàn)錯(cuò)漏將直接導(dǎo)致數(shù)據(jù)解析出錯(cuò),另外,數(shù)據(jù)規(guī)則過多也容易導(dǎo)致數(shù)據(jù)解析出現(xiàn)混亂,因此需要優(yōu)化解析規(guī)則,確定較優(yōu)的數(shù)據(jù)存儲(chǔ)方式;

      (2)數(shù)據(jù)所包含的信息不夠全面:文件中僅包含數(shù)據(jù)內(nèi)容,不包含對(duì)數(shù)據(jù)的解釋信息,必須依賴解析規(guī)則中的解釋字段才能識(shí)別解析數(shù)據(jù)的意義,因此,需要盡可能地將解釋字段也包含在數(shù)據(jù)文件中。

      3.2 文件命名標(biāo)準(zhǔn)化

      3.2.1 機(jī)組簡標(biāo)規(guī)范

      現(xiàn)有的數(shù)據(jù)文件中,部分文件存在 “核電機(jī)組簡標(biāo)”這一字段,根據(jù)解析出來的數(shù)據(jù),該數(shù)據(jù)長度不固定,如“TW05”、“HYH05”,在字符前還有部分非打印ASCII碼字符,如文件結(jié)束傳遞標(biāo)識(shí)等。為進(jìn)行統(tǒng)一,現(xiàn)對(duì)核電機(jī)組簡標(biāo)做如下標(biāo)準(zhǔn)化規(guī)定:

      核電機(jī)組簡標(biāo)統(tǒng)一由5位字符組成,通用格式可以表示為:“XXXYY”,其中,“XXX”表示電站簡標(biāo),為三位大寫英文字母,“YY”為兩位數(shù)字,代表機(jī)組編號(hào)。

      核電機(jī)組簡標(biāo)的命名方式借鑒了國際航空運(yùn)輸協(xié)會(huì)制定的全球機(jī)場(chǎng)代碼命名規(guī)則,電站簡標(biāo)由三位字母組成,為核電基地拼音首字母大寫,當(dāng)核電基地為三字時(shí),取每個(gè)字的拼音首字母,當(dāng)核電基地為二字時(shí),取第一字拼音首字母和第二字拼音前兩位,如紅沿河(HYH)和海陽(HYA),當(dāng)出現(xiàn)沖突時(shí),新機(jī)組名稱應(yīng)當(dāng)更換為其他字母。新命名規(guī)則的優(yōu)點(diǎn)是能快速識(shí)別當(dāng)前電站和機(jī)組,且可使用的字母范圍較廣。由此對(duì)全國所有在運(yùn)行及規(guī)劃機(jī)組進(jìn)行命名,制定機(jī)組簡標(biāo)標(biāo)準(zhǔn)規(guī)范,如表5所示。

      表5 機(jī)組簡標(biāo)標(biāo)準(zhǔn)規(guī)范(節(jié)選)

      3.2.2 文件命名規(guī)范

      統(tǒng)一機(jī)組簡標(biāo)后,可以對(duì)文件命名格式進(jìn)行規(guī)范,文件命名格式可以表示為:XXXYY_TTTT_YYYYMMDDhhmmss_AA.xxx,具體表示方法為“機(jī)組簡標(biāo)_類型_日期時(shí)間_編碼.后綴名”,其中,各字段對(duì)應(yīng)含義如表6所示。值得注意的是,文件命名規(guī)范規(guī)定了每個(gè)字段的長度,所以在 “類型”字段中,所有的產(chǎn)品均采用了四位字母的編碼方式,并以產(chǎn)品英文縮寫為主,若字符不夠四位(如“VMS”),則使用第一個(gè)實(shí)詞的非元音字母進(jìn)行補(bǔ)位(如“VBMS”)[18]。

      表6 文件命名格式規(guī)范

      各個(gè)字段以下劃線 “_”分隔,便于閱讀,文件名長度固定,包含電站機(jī)組、數(shù)據(jù)類型、日期時(shí)間等關(guān)鍵信息。

      3.3 文件編碼方式標(biāo)準(zhǔn)化

      1)數(shù)據(jù)編碼規(guī)范:統(tǒng)一使用低位有效、大端編碼方式進(jìn)行數(shù)據(jù)存儲(chǔ),即將二進(jìn)制數(shù)據(jù)的高位存放在內(nèi)存的低地址中,將二進(jìn)制數(shù)據(jù)的低位存放在內(nèi)存的高地址中,同時(shí)在每個(gè)內(nèi)存空間中先存放字節(jié)的低位數(shù)據(jù)。對(duì)于目前采用小端編碼方式存儲(chǔ)的數(shù)據(jù),采用交換字節(jié)順序等方式將其轉(zhuǎn)化為大端編碼模式。在后續(xù)數(shù)據(jù)讀取時(shí),同樣按照低位有效、大端編碼的方式進(jìn)行讀取。

      2)字符編碼規(guī)范:目前數(shù)據(jù)資源中存在英文字母字符、數(shù)字字符、特殊符號(hào)字符和漢字字符,其中前三種字符屬于ASCII編碼,漢字屬于GBK 編碼規(guī)范,在數(shù)據(jù)標(biāo)準(zhǔn)化中,將統(tǒng)一使用UTF-8的編碼方式。UTF-8編碼是一種使用廣泛、包含字符數(shù)量極多的一種編碼規(guī)范,使用UTF-8編碼可以將所有語言體系下各種類型的字符都涵蓋[19]。

      3)字節(jié)對(duì)齊規(guī)范:統(tǒng)一使用1字節(jié)對(duì)齊模式,需要在編譯、解析軟件中進(jìn)行說明。當(dāng)使用其他字節(jié)對(duì)齊方式時(shí),可能會(huì)出現(xiàn)空字節(jié)等情況[20]。

      3.4 文件數(shù)據(jù)類型標(biāo)準(zhǔn)化

      數(shù)據(jù)是數(shù)據(jù)文件最重要的內(nèi)容,數(shù)據(jù)類型標(biāo)準(zhǔn)化對(duì)已有的數(shù)據(jù)類型進(jìn)行統(tǒng)一編碼,規(guī)定對(duì)應(yīng)的字節(jié)數(shù)、位數(shù)和計(jì)算規(guī)則,在后續(xù)數(shù)據(jù)的存儲(chǔ)和讀取中都統(tǒng)一使用該標(biāo)準(zhǔn)規(guī)則,將數(shù)據(jù)資源中的12種類型縮減到7種,并給每一種數(shù)據(jù)類型賦予固定的“編碼”,制定的數(shù)據(jù)類型標(biāo)準(zhǔn)規(guī)范如表7所示。

      表7 數(shù)據(jù)類型規(guī)范

      3.5 解析規(guī)則標(biāo)準(zhǔn)化

      為了將解析規(guī)則標(biāo)準(zhǔn)化,首先制定標(biāo)準(zhǔn)化通用解析規(guī)則,當(dāng)前階段,準(zhǔn)化通用解析規(guī)則(包括各類標(biāo)準(zhǔn)化規(guī)范)都使用Excel表格形式建立,后續(xù)逐步在數(shù)據(jù)庫中建立。標(biāo)準(zhǔn)化通用解析規(guī)則如表8所示,其中,“循環(huán)采集次數(shù)”指某些產(chǎn)品會(huì)進(jìn)行特定次數(shù)的平滑計(jì)算,該次數(shù)為前期指定。

      表8 通用解析規(guī)則表

      將VMS某產(chǎn)品的數(shù)據(jù)解析規(guī)則轉(zhuǎn)化成通用解析規(guī)則,如表9所示。

      表9 解析規(guī)則標(biāo)準(zhǔn)化后的VMS某產(chǎn)品數(shù)據(jù)解析規(guī)則(節(jié)選)

      通用解析規(guī)則的優(yōu)點(diǎn)在于:

      1)規(guī)則表形式結(jié)構(gòu)標(biāo)準(zhǔn)固定:規(guī)則表的結(jié)構(gòu)一經(jīng)確定就不需更改,只需要往里面填入對(duì)應(yīng)字段,且填寫內(nèi)容除屬性、通道、單位外,全部為數(shù)字,便于軟件進(jìn)行識(shí)別;

      2)規(guī)則表適配度高,解析規(guī)則得到優(yōu)化:根據(jù)目前的實(shí)踐情況,通用解析規(guī)則表適配于松脫、振動(dòng)、主泵的所有“.dat”文件格式,也適配于 “.sig”、“.cbv”等非標(biāo)準(zhǔn)格式;

      3)閱讀簡單,數(shù)據(jù)清晰:通用解析規(guī)則表在填入內(nèi)容以后,內(nèi)容非常清晰,因?yàn)檩^多需要重復(fù)填寫的內(nèi)容都可以賦空值,由程序自行運(yùn)算,因而相較于原始解析規(guī)則,可閱讀性得到了較大提升。

      3.6 數(shù)據(jù)存儲(chǔ)與讀取標(biāo)準(zhǔn)化

      3.6.1 “八字節(jié)法”標(biāo)準(zhǔn)化數(shù)據(jù)存儲(chǔ)方法

      數(shù)據(jù)存儲(chǔ)使用“八字節(jié)法(8-Byte,B8)”標(biāo)準(zhǔn)化數(shù)據(jù)存儲(chǔ)方法,對(duì)應(yīng)“八字節(jié)法(B8)”標(biāo)準(zhǔn)化讀取方法?!鞍俗止?jié)法(B8)”標(biāo)準(zhǔn)化數(shù)據(jù)存儲(chǔ)方法是一種為故障診斷產(chǎn)品數(shù)據(jù)定制的數(shù)據(jù)存儲(chǔ)方法,規(guī)定數(shù)據(jù)文件由以下三部分內(nèi)容構(gòu)成:1)頭文件;2)頭文件結(jié)束標(biāo)志;3)數(shù)據(jù)。

      1)頭文件:頭文件部分按照每八字節(jié)存儲(chǔ)一個(gè) “屬性”下的一個(gè) “通道”的 “單位”和 “數(shù)據(jù)”相關(guān)信息,故稱為“八字節(jié)法”。“八字節(jié)法”頭文件定義規(guī)則如表10所示。

      表10 “八字節(jié)法”頭文件定義規(guī)則

      “八字節(jié)法”限制每個(gè) “屬性”、“通道”以及 “單位”的字符串長度為127個(gè)字節(jié),一般情況下字符長度滿足要求;數(shù)據(jù)類型小于127 種,根據(jù)數(shù)據(jù)類型標(biāo)準(zhǔn)表的定義,當(dāng)前只定義了7種數(shù)據(jù)類型;數(shù)據(jù)數(shù)量為32位整型,數(shù)據(jù)范圍非常大,各種類型數(shù)據(jù)均滿足要求。

      2)頭文件結(jié)束標(biāo)志:頭文件所有數(shù)據(jù)存儲(chǔ)完畢以后,存儲(chǔ)一個(gè)全部為1(0xFF)的八字節(jié)數(shù)據(jù)作為頭文件結(jié)束標(biāo)志。

      3)數(shù)據(jù):在頭文件結(jié)束標(biāo)志以后,按照頭文件的規(guī)定順序存放數(shù)據(jù)。

      3.6.2 數(shù)據(jù)的讀取方法

      當(dāng)數(shù)據(jù)文件按照 “八字節(jié)法”進(jìn)行存儲(chǔ)時(shí),數(shù)據(jù)的讀取將變得非常簡單,讀取八字節(jié)格式的文件不需要任何的解析規(guī)則,僅需要八字節(jié)格式編碼的逆算法——解碼算法即可。

      八字節(jié)格式文件的讀取方式如下:

      1)以流式數(shù)據(jù)方式打開 “.dat”文件,每次將八個(gè)字節(jié)的內(nèi)容讀入內(nèi)存,其中,第一個(gè)字節(jié)內(nèi)容為 “屬性”字段字節(jié)長度,第二個(gè)字節(jié)內(nèi)容為 “通道”字段字節(jié)長度,第三個(gè)字節(jié)內(nèi)容為 “單位”字段字節(jié)長度,第四個(gè)字節(jié)內(nèi)容為數(shù)據(jù)類型,第五至八字節(jié)內(nèi)容為數(shù)據(jù)數(shù)量,解析規(guī)則和表完全一致,將讀取并解析后的數(shù)據(jù)存放進(jìn)內(nèi)存中;

      2)當(dāng)讀取到八個(gè)全為1(0xFF)的字節(jié)時(shí),頭文件讀取結(jié)束,此時(shí)內(nèi)存中的頭文件解析數(shù)據(jù)即為該文件的“目錄”;

      3)在頭文件結(jié)束標(biāo)志后,按照 “目錄”中的 “屬性”字符長度、“通道”字符長度、“單位”字符長度、數(shù)據(jù)類型和數(shù)據(jù)數(shù)量,依次讀取對(duì)應(yīng)的數(shù)據(jù)并解析。數(shù)據(jù)讀取完成后,同樣存儲(chǔ)在標(biāo)準(zhǔn)化數(shù)據(jù)結(jié)構(gòu)體中。

      3.6.3 “八字節(jié)法”的優(yōu)點(diǎn)

      “八字節(jié)法”標(biāo)準(zhǔn)化數(shù)據(jù)存儲(chǔ)方法具有如下優(yōu)點(diǎn):

      1)數(shù)據(jù)文件完全脫離于解析規(guī)則:按照 “八字節(jié)法”存儲(chǔ)的數(shù)據(jù)文件不再依賴于復(fù)雜的解析規(guī)則,通過算法解碼可以直接讀取文件的全部內(nèi)容;

      2)數(shù)據(jù)解碼方法簡單:通過簡單的解碼算法即可將文件內(nèi)容解析出來,算法簡單,易于理解,通過編寫簡單的程序模塊即可實(shí)現(xiàn)數(shù)據(jù)解析;

      3)數(shù)據(jù)文件結(jié)構(gòu)固定:所有的八字節(jié)文件格式固定包括“頭文件”、“頭文件結(jié)束標(biāo)志”、“數(shù)據(jù)”三部分內(nèi)容,使文件各部分易于識(shí)別,各部分內(nèi)容長度根據(jù)需要?jiǎng)討B(tài)變化;

      4)文件標(biāo)準(zhǔn)化程度高:數(shù)據(jù)文件經(jīng)過文件格式標(biāo)準(zhǔn)化(均采用“.dat”存儲(chǔ)格式)、文件命名標(biāo)準(zhǔn)化、數(shù)據(jù)類型標(biāo)準(zhǔn)化和編碼方式標(biāo)準(zhǔn)化(大端編碼),標(biāo)準(zhǔn)化程度高;

      5)易于錯(cuò)誤排查:根據(jù)八字節(jié)編碼特性和頭文件結(jié)束標(biāo)志,容易排查“.dat”文件是否存在字節(jié)錯(cuò)位、漏字節(jié)等情況。

      3.7 數(shù)據(jù)標(biāo)準(zhǔn)化的實(shí)踐效果

      針對(duì)反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)現(xiàn)有資源,通過文件格式標(biāo)準(zhǔn)化、文件命名標(biāo)準(zhǔn)化、文件編碼方式標(biāo)準(zhǔn)化、文件數(shù)據(jù)類型標(biāo)準(zhǔn)化、解析規(guī)則標(biāo)準(zhǔn)化以及數(shù)據(jù)存儲(chǔ)與讀取標(biāo)準(zhǔn)化等手段,初步實(shí)現(xiàn)了數(shù)據(jù)標(biāo)準(zhǔn)化,部分經(jīng)標(biāo)準(zhǔn)化后的數(shù)據(jù)資源如圖2 所示。可以看出,所有的數(shù)據(jù)文件都是“.dat”格式,并且嚴(yán)格按照前述機(jī)組簡標(biāo)規(guī)范和文件命名規(guī)范進(jìn)行命名,所有的數(shù)據(jù)文件統(tǒng)一采用大端編碼、字符采用UTF-8編碼、1字節(jié)對(duì)齊方式,并且所有文件都按照“八字節(jié)法”標(biāo)準(zhǔn)化方法進(jìn)行存儲(chǔ)。

      圖2 經(jīng)過標(biāo)準(zhǔn)化處理后的數(shù)據(jù)文件(部分)

      通過數(shù)據(jù)標(biāo)準(zhǔn)化,故障診斷產(chǎn)品所采集的反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)資源在統(tǒng)一性、標(biāo)準(zhǔn)性和規(guī)范性上得到了極大提升,數(shù)據(jù)標(biāo)準(zhǔn)化的效果如表11所示。

      表11 數(shù)據(jù)標(biāo)準(zhǔn)化前后的效果對(duì)比

      4 結(jié)束語

      數(shù)據(jù)標(biāo)準(zhǔn)化主要聚焦于缺乏規(guī)范性、統(tǒng)一性的數(shù)據(jù)資源。本文首先梳理了反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)的數(shù)據(jù)資源現(xiàn)狀,整理了當(dāng)前數(shù)據(jù)資源存在的問題;然后提出了數(shù)據(jù)標(biāo)準(zhǔn)化的思路和方法,從文件格式、文件命名、文件編碼方式、文件數(shù)據(jù)類型、解析規(guī)則、數(shù)據(jù)讀取、數(shù)據(jù)存儲(chǔ)等方面進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化實(shí)踐,定義了機(jī)組簡標(biāo)規(guī)范、文件命名規(guī)范、數(shù)據(jù)編碼規(guī)范、字符編碼規(guī)范等標(biāo)準(zhǔn)化規(guī)范用以對(duì)數(shù)據(jù)資源進(jìn)行約束。通過數(shù)據(jù)標(biāo)準(zhǔn)化實(shí)踐,反應(yīng)堆關(guān)鍵設(shè)備狀態(tài)數(shù)據(jù)資源的統(tǒng)一性、規(guī)范性和標(biāo)準(zhǔn)性得到了極大提升,充分提高了數(shù)據(jù)質(zhì)量和管理的效率。

      隨著“數(shù)字化反應(yīng)堆”建設(shè)的推進(jìn)和數(shù)字化轉(zhuǎn)型的迫切需求,數(shù)據(jù)資源將迎來新一輪的使用和研究熱潮,為了提升數(shù)據(jù)資源的使用效率、增強(qiáng)數(shù)據(jù)質(zhì)量,確保最大限度挖掘數(shù)據(jù)資源的內(nèi)在價(jià)值,數(shù)據(jù)標(biāo)準(zhǔn)化應(yīng)該作為一種重要的數(shù)據(jù)管理手段貫穿數(shù)據(jù)使用的全流程,避免由于數(shù)據(jù)資源混亂而造成的數(shù)據(jù)浪費(fèi)。除數(shù)據(jù)標(biāo)準(zhǔn)化以外,數(shù)據(jù)管理中還包含了數(shù)據(jù)安全管理、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)資產(chǎn)管理、數(shù)據(jù)生命周期管理等多方面,后續(xù)可以根據(jù)需要在核電故障診斷產(chǎn)品數(shù)據(jù)資源中進(jìn)行進(jìn)一步探索和實(shí)踐。

      猜你喜歡
      編碼方式數(shù)據(jù)類型數(shù)據(jù)文件
      詳談Java中的基本數(shù)據(jù)類型與引用數(shù)據(jù)類型
      如何理解數(shù)據(jù)結(jié)構(gòu)中的抽象數(shù)據(jù)類型
      數(shù)據(jù)文件恢復(fù)專題問答
      數(shù)據(jù)文件安全管控技術(shù)的研究與實(shí)現(xiàn)
      SQL數(shù)據(jù)文件恢復(fù)工具
      GCOA算法
      可穿戴式多通道傳感系統(tǒng)功能需求分析及設(shè)計(jì)
      混合編碼方式自適應(yīng)差分進(jìn)化算法優(yōu)化設(shè)計(jì)寬帶天線
      Tekla Structure數(shù)據(jù)文件交互格式分析
      淺談?dòng)?jì)算機(jī)網(wǎng)絡(luò)通信中實(shí)時(shí)差錯(cuò)控制技術(shù)
      建宁县| 台南市| 浦北县| 富平县| 荃湾区| 江安县| 休宁县| 宜君县| 长丰县| 孟州市| 贺州市| 巫溪县| 郯城县| 福贡县| 株洲市| 门源| 普格县| 安西县| 贵南县| 弋阳县| 璧山县| 吐鲁番市| 兴海县| 海口市| 松滋市| 大宁县| 赣榆县| 阿鲁科尔沁旗| 云浮市| 荆州市| 工布江达县| 改则县| 庆阳市| 平遥县| 阿坝| 建昌县| 西贡区| 余庆县| 波密县| 奉节县| 沈丘县|