◆劉 璇 王 坤
(吉林省藥品檢驗(yàn)所 吉林 130033)
近年來,以大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能、5G為核心特征的數(shù)字化浪潮正席卷全球,我們迎來了大數(shù)據(jù)時(shí)代,與檢驗(yàn)相關(guān)的各類信息系統(tǒng)日益成熟,更多的系統(tǒng)數(shù)據(jù)每天以數(shù)以萬倍的速度不斷增長(zhǎng)。2015年8月,國(guó)務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》中指出,大數(shù)據(jù)已成為“提升政府治理能力的新途徑”。十九大以來,習(xí)總書記對(duì)建設(shè)網(wǎng)絡(luò)強(qiáng)國(guó)、數(shù)字中國(guó)、智慧社會(huì)高度重視。2018年《“數(shù)字吉林”建設(shè)規(guī)劃》也提出“完善相關(guān)標(biāo)準(zhǔn)體系,建設(shè)互聯(lián)協(xié)同、滿足監(jiān)管需求的行政審批、監(jiān)管檢查等應(yīng)用系統(tǒng)”。因此,加快推進(jìn)檢驗(yàn)信息系統(tǒng)數(shù)據(jù)的規(guī)范化建設(shè),是行業(yè)持續(xù)健康發(fā)展的重要保障。
目前,我國(guó)藥品領(lǐng)域檢驗(yàn)信息系統(tǒng)數(shù)據(jù)的利用度不高,缺乏科學(xué)、深入的規(guī)范化分析與管理,過往的管理方式僅僅是對(duì)采集到的數(shù)據(jù)進(jìn)行簡(jiǎn)單的歸類,缺少有意義、有價(jià)值的深度挖掘。之所以出現(xiàn)這樣的現(xiàn)象,是由于這些檢驗(yàn)數(shù)據(jù)存在實(shí)時(shí)、孤立、多源、異構(gòu)、龐雜、無序的特征,從技術(shù)層面分析,其根本原因在于缺乏先進(jìn)的數(shù)據(jù)管理手段。因此,通過數(shù)據(jù)分類及編碼等技術(shù)手段,將數(shù)據(jù)進(jìn)行有效整合形成豐富的數(shù)據(jù)庫,對(duì)檢驗(yàn)信息系統(tǒng)的規(guī)范化管理和標(biāo)準(zhǔn)提高都具有巨大的應(yīng)用價(jià)值和實(shí)際意義。
檢驗(yàn)信息系統(tǒng)是對(duì)實(shí)驗(yàn)室“人機(jī)料法環(huán)測(cè)”六個(gè)主要因素進(jìn)行信息化管理,是實(shí)驗(yàn)室信息管理系統(tǒng)(LIMS)(Laboratory Information Management System)的重要組成部分(見圖1)。在系統(tǒng)的構(gòu)建中,通過對(duì)數(shù)據(jù)和流程進(jìn)行規(guī)范,解決因含糊業(yè)務(wù)邏輯、不規(guī)范編碼和無實(shí)際意義等出現(xiàn)的數(shù)據(jù)(又稱“臟數(shù)據(jù)”)質(zhì)量低等問題(見圖2)?!芭K數(shù)據(jù)”產(chǎn)生的原因是因其來源不同,它的表述方法、單位、數(shù)據(jù)格式可能大相徑庭。“臟數(shù)據(jù)”不能直接進(jìn)行采集、分析和統(tǒng)計(jì),必須進(jìn)行數(shù)據(jù)清理、數(shù)據(jù)挖掘,以保證LIMS各系統(tǒng)的一致性和完整性,同時(shí)保證有效、準(zhǔn)確的檢驗(yàn)數(shù)據(jù)能被高質(zhì)量的利用,實(shí)現(xiàn)數(shù)據(jù)資源應(yīng)用最大化。
圖1 檢驗(yàn)信息系統(tǒng)
檢驗(yàn)信息系統(tǒng)數(shù)據(jù)規(guī)范化管理的構(gòu)建,有利于行業(yè)內(nèi)部縱向信息的整合,實(shí)現(xiàn)互聯(lián)互通,還有利于跨系統(tǒng)的政府橫向信息整合,實(shí)現(xiàn)資源共享、業(yè)務(wù)協(xié)同,為藥品行業(yè)市場(chǎng)監(jiān)管提供可靠的數(shù)據(jù)保障。
圖 2 “臟數(shù)據(jù)”樣例
數(shù)據(jù)元(Data element):通過定義、標(biāo)識(shí)、表示以及允許值等一系列屬性描述的數(shù)據(jù)單元,是不可再分的最小數(shù)據(jù)單元,這里規(guī)定了檢驗(yàn)數(shù)據(jù)元的標(biāo)識(shí)符、中文名稱、短名、定義、數(shù)據(jù)類型和值域等。表1列出了數(shù)據(jù)元的所有屬性。
表1 數(shù)據(jù)元屬性
舉例如表2所示:
表2 數(shù)據(jù)信息數(shù)據(jù)元
標(biāo)識(shí)符:為數(shù)據(jù)元分配的與語言無關(guān)的唯一標(biāo)識(shí)。
DE:Data Element,表示數(shù)據(jù)元。
業(yè)務(wù)領(lǐng)域代碼:用2位數(shù)字表示,數(shù)字大小無含義,從01開始編碼。
順序號(hào):用3位數(shù)字表示,數(shù)字大小無含義,從001開始編碼。業(yè)務(wù)領(lǐng)域代碼和順序號(hào)之間加“.”隔開(見圖3)。
數(shù)據(jù)元值域:數(shù)據(jù)元通常有一個(gè)允許值的集合,這個(gè)集合被稱為值域,數(shù)據(jù)元允許值的類型和所允許的最大和/或最小長(zhǎng)度、數(shù)據(jù)元值的表示格式。表3列出了數(shù)據(jù)類型,表4列出了數(shù)據(jù)格式,這里規(guī)定了檢驗(yàn)數(shù)據(jù)分類規(guī)范、編碼規(guī)范以及相關(guān)信息的數(shù)據(jù)元值域。
圖3 數(shù)據(jù)元標(biāo)識(shí)符結(jié)構(gòu)
表3 數(shù)據(jù)元值的數(shù)據(jù)類型
表4 數(shù)據(jù)元值的數(shù)據(jù)格式
舉例如表5:
表5 標(biāo)準(zhǔn)類型代碼表(CV05.005)
代碼表格式及標(biāo)識(shí):數(shù)據(jù)元值域代碼表應(yīng)以表格的形式列出,表格由值和值含義兩欄組成。代碼表具有唯一標(biāo)識(shí)符,用來識(shí)別和表示數(shù)據(jù)元值的編碼體系。
CV:Coded Value,表示數(shù)據(jù)元值域。
業(yè)務(wù)領(lǐng)域代碼:2位數(shù)字,表示檢驗(yàn)信息系統(tǒng)數(shù)據(jù)管理規(guī)范基礎(chǔ)數(shù)據(jù)元中業(yè)務(wù)領(lǐng)域的代碼。
順序號(hào):用3位數(shù)字表示,代表每一類別下值域代碼表對(duì)應(yīng)的數(shù)據(jù)元在基礎(chǔ)數(shù)據(jù)元中的序號(hào)。業(yè)務(wù)領(lǐng)域代碼和順序號(hào)之間加“.”隔開(見圖4)。
圖4 數(shù)據(jù)元值域代碼表標(biāo)識(shí)符
隨著藥品檢驗(yàn)行業(yè)的蓬勃發(fā)展,檢驗(yàn)信息系統(tǒng)無論是在日常生活,還是在生產(chǎn)工作中都發(fā)揮著難以替代的作用,檢驗(yàn)數(shù)據(jù)的橫向?qū)挾扰c縱向高度也在擴(kuò)大,實(shí)驗(yàn)室的信息化建設(shè)越深入、使用的信息系統(tǒng)越多,各種業(yè)務(wù)數(shù)據(jù)也積累越多,因此構(gòu)建統(tǒng)一規(guī)范的數(shù)據(jù)管理體系,保證可靠準(zhǔn)確的檢驗(yàn)數(shù)據(jù)能被高質(zhì)量的利用是重中之重。當(dāng)前民營(yíng)第三方檢驗(yàn)檢測(cè)機(jī)構(gòu)略顯規(guī)模、生產(chǎn)企業(yè)自檢實(shí)驗(yàn)室逐漸壯大,對(duì)出具的檢驗(yàn)數(shù)據(jù)、工作程序的規(guī)范都提出更高的要求。
檢驗(yàn)信息系統(tǒng)的數(shù)據(jù)規(guī)范化管理,一方面可實(shí)現(xiàn)數(shù)據(jù)高效、準(zhǔn)確的傳輸和應(yīng)用,提高信息系統(tǒng)的易維護(hù)性、可重復(fù)性、和可集成性,加快整個(gè)行業(yè)的信息化進(jìn)程;另一方面打破各個(gè)系統(tǒng)自為政的現(xiàn)象,提高檢驗(yàn)數(shù)據(jù)的利用率,為產(chǎn)業(yè)大數(shù)據(jù)的高效應(yīng)用積累數(shù)據(jù),為各級(jí)主管部門提供及時(shí)、有效、權(quán)威的數(shù)據(jù)支撐,使宏觀控制、局部調(diào)整有據(jù)可依,更為各行業(yè)的信息化發(fā)展摸索經(jīng)驗(yàn),提升信息化在檢驗(yàn)工作中的重要地位,使信息系統(tǒng)真正在產(chǎn)品檢驗(yàn)、監(jiān)督管理中發(fā)揮保障作用。