• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種基于標(biāo)簽云的文本可視化方法

    2020-06-12 09:47:44李曉飛
    電子元器件與信息技術(shù) 2020年3期
    關(guān)鍵詞:彩信度量可視化

    李曉飛

    (吉林建筑科技學(xué)院,吉林 長春 130000)

    0 引言

    可視化(Visualization)是利用計算機圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換成圖形或圖像在屏幕上顯示出來,并進(jìn)行交互處理的理論、方法和技術(shù)。它涉及到計算機圖形學(xué)、圖像處理、計算機視覺、計算機輔助設(shè)計等多個領(lǐng)域,成為研究數(shù)據(jù)表示、數(shù)據(jù)處理、決策分析等一系列問題的綜合技術(shù)[1]。目前正在飛速發(fā)展的虛擬現(xiàn)實技術(shù)也是以圖形圖像的可視化技術(shù)為依托的。

    數(shù)據(jù)存儲以及數(shù)據(jù)傳播的主要形式包括文本,而可視化技術(shù)研究的一個重要的方向就是文本數(shù)據(jù)的可視化。目前研究者們提出了可視化技術(shù)研究的一些方法,比如文本語義結(jié)構(gòu)方法、標(biāo)簽云方法等[2-4]。標(biāo)簽云是一套相關(guān)的標(biāo)簽以及與此相應(yīng)的權(quán)重。權(quán)重影響使用的字體大小或其他視覺效果。標(biāo)簽云彩能代表更多的權(quán),標(biāo)簽是典型的超鏈接,讓用戶可以仔細(xì)了解他們的內(nèi)容[5-7]。

    目前對可視化技術(shù)的評價方法尚處于發(fā)展階段。本項目進(jìn)行過程中主要工作為建立文本數(shù)據(jù)可視化方法度量指標(biāo),根據(jù)計算結(jié)果對權(quán)重值進(jìn)行計算,從而分析文本信息可視化的應(yīng)用效果[8]。

    1 基于標(biāo)簽云的文本可視化方法

    基于標(biāo)簽元的文本可視化方法通過建立三類度量指標(biāo),從而根據(jù)度量指標(biāo)進(jìn)行權(quán)重計算,最后進(jìn)行評價分?jǐn)?shù)計算。

    1.1 數(shù)據(jù)指標(biāo)

    在可視化技術(shù)中,數(shù)據(jù)的規(guī)模大小是整個量化和評價過程的基礎(chǔ)。標(biāo)簽云根據(jù)文本數(shù)據(jù)單詞的頻率由大到小進(jìn)行展現(xiàn),因此數(shù)據(jù)的規(guī)模指標(biāo)是評價可視化效果的一個重要指標(biāo)。

    假設(shè)文本數(shù)據(jù)中單詞的集合為S{a1,a2,……an},其中ai(i=1,2, ,n)代表文本信息中的某個單詞,令N(ai)表示文本中單詞出現(xiàn)的個數(shù)。定義停止詞集合,表示在文本數(shù)據(jù)中多次出現(xiàn)但是對文本內(nèi)容影響小的單詞為P={p1,p2,……pm},例如中文中出現(xiàn)“的”“是”“個”等詞,英文中的of、a、an、the 等詞。

    對文本數(shù)據(jù)可視化的步驟為:①篩選文本數(shù)據(jù)中的單詞——彩信詞;②根據(jù)單詞集合S和停止詞集合P對文本進(jìn)行過濾得到S-P;③計算S-P中的單詞出現(xiàn)的頻度;④選取頻度閾值h,篩選得彩信詞集C。

    1.2 復(fù)雜度指標(biāo)

    復(fù)雜度指標(biāo)主要指用戶對文本信息進(jìn)行搜索和觀察,本方法主要通過方向度量和采信詞度量進(jìn)行衡量。

    彩信詞度量指單詞在可視化確定區(qū)域的長寬比:

    上式中I為單詞圖片的長,W為寬。彩信詞集C中所有單詞的度量均值為:

    每個單詞出現(xiàn)在可視化區(qū)域的大小則取決于權(quán)重,權(quán)重大的顯示較大。但是對于一些單詞長度大而權(quán)重小的情況下彩信詞度量同樣也較大。為了解決這個問題,增加方向度量來進(jìn)行評價。假設(shè)單詞的角度為ui度,可視化確定區(qū)域展現(xiàn)的方向度量為:

    d(ai)的取值范圍為[0,1],方向度量越大,復(fù)雜度指標(biāo)越高。

    1.3 辨識度指標(biāo)

    辨識度指標(biāo)主要用來呈現(xiàn)單詞色彩的比重以及在可視化展現(xiàn)區(qū)域的位置構(gòu)成。假設(shè)標(biāo)簽云中每個文本數(shù)據(jù)顯示不同顏色,顏色的數(shù)目為nc,彩信詞的數(shù)量為n,則設(shè)定色彩比重為:

    在文本可視化的展現(xiàn)區(qū)域經(jīng)常會出現(xiàn)空白區(qū)域,這些區(qū)域采用空間利用度來衡量,可以通過填充空白區(qū)域來增加空間的利用度。假設(shè)單詞所占區(qū)域面積為t,展現(xiàn)區(qū)域的面積t=W×L,其中W和L分別為展現(xiàn)區(qū)域的寬和長,則空間利用度為:

    1.4 權(quán)重計算

    根據(jù)數(shù)據(jù)規(guī)模指標(biāo)、復(fù)雜度指標(biāo)以及辨識度指標(biāo)進(jìn)行權(quán)重的計算。通過模糊分析方法對權(quán)值進(jìn)行確定。對上述三個指標(biāo)進(jìn)行兩兩互相比對,形成模糊矩陣B,然后將其變成模糊一致性判斷矩陣R:

    數(shù)據(jù)指標(biāo)、復(fù)雜度指標(biāo)和辨識度指標(biāo)對總評分的影響權(quán)重為qw=(0.316,0.419,0.263)。

    1.5 評價分?jǐn)?shù)計算

    根據(jù)相應(yīng)指標(biāo)的計算和權(quán)重計算,進(jìn)行了文本數(shù)據(jù)信息頻度算法的分析,算法的具體過程為:

    Step1:文本數(shù)據(jù)信息可視化參數(shù)初始化處理。比如在可視化確定區(qū)域展示的單詞的最大和最小數(shù)量,色彩度的最大值,展示區(qū)域顏色的設(shè)置等。

    Step2:計算文本信息的總單詞數(shù)量。

    Step3:根據(jù)過濾條件確定彩信詞集合,并計算需要可視化展示的單詞信息。

    Step4:初始化可視化區(qū)域畫布和單詞信息,將單詞展現(xiàn)在畫布上。

    Step5:對統(tǒng)計單詞進(jìn)行面積比率和方向度量計算。根據(jù)計算公式,獲得可視化分析的指標(biāo)值。

    2 實驗及結(jié)果分析

    實驗中,通過對網(wǎng)絡(luò)授課學(xué)生對科目反饋科目信息,采用標(biāo)簽云可視化方法進(jìn)行指標(biāo)計算和分析,從而得到可視化結(jié)果,如圖1。

    其中計算出方向度量值為0.61,彩信詞密度為0.112,顏色比重為0.146,空間利用度為1.689。根據(jù)指標(biāo)值得到最終的總評價分?jǐn)?shù)為65.12。

    實驗中對單文本和多文本來調(diào)整算法中可視化指標(biāo)并采用多維度圖表進(jìn)行結(jié)果分析。彩信詞指標(biāo)折線分析圖如圖2,色彩比重分析圖如圖3。

    由分析圖可知,隨著彩信詞密度的增加,方向度量基本是在百分之五十左右上下波動,方度max 值則逐漸上升到平穩(wěn),評價總分逐漸下降,可視化效果逐漸變差。

    3 結(jié)論

    本文給出了一種基于標(biāo)簽云的文本可視化分析方法,主要通過建立文本數(shù)據(jù)可視化方法度量指標(biāo),根據(jù)計算結(jié)果對權(quán)重值進(jìn)行計算,從而分析文本信息可視化的應(yīng)用效果。實驗證明,針對但文本以及多文本信息,各指標(biāo)間是相互對立的,該方法在可視化衡量上具有一定的有效性。

    猜你喜歡
    彩信度量可視化
    有趣的度量
    基于CiteSpace的足三里穴研究可視化分析
    模糊度量空間的強嵌入
    基于Power BI的油田注水運行動態(tài)分析與可視化展示
    云南化工(2021年8期)2021-12-21 06:37:54
    基于CGAL和OpenGL的海底地形三維可視化
    迷向表示分為6個不可約直和的旗流形上不變愛因斯坦度量
    “融評”:黨媒評論的可視化創(chuàng)新
    傳媒評論(2019年4期)2019-07-13 05:49:14
    彩信的巔峰與隕落
    地質(zhì)異常的奇異性度量與隱伏源致礦異常識別
    彩信系統(tǒng)網(wǎng)絡(luò)與業(yè)務(wù)安全風(fēng)險淺析
    周口市| 东明县| 察哈| 防城港市| 巴里| 洛阳市| 南投县| 屯昌县| 武山县| 阳谷县| 谢通门县| 陇南市| 洛宁县| 太谷县| 郁南县| 东丽区| 三明市| 枣强县| 固始县| 宜兴市| 灵宝市| 乐至县| 腾冲县| 铁岭县| 铁岭市| 叶城县| 芷江| 汉阴县| 五峰| 平利县| 昌平区| 梁平县| 永仁县| 布拖县| 砚山县| 邓州市| 桂林市| 孝感市| 申扎县| 石阡县| 平顺县|