• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      虛擬學習社區(qū)中意見領袖識別模型研究

      2020-05-22 13:55:48李艷翠訾乾龍李宗儒張平川
      計算機技術與發(fā)展 2020年5期
      關鍵詞:特征向量領袖聚類

      許 睿,李艷翠,訾乾龍,李宗儒,張平川

      (河南科技學院 信息工程學院,河南 新鄉(xiāng) 453003)

      0 引 言

      “意見領袖”這一概念最早出現(xiàn)于1940年,由拉扎斯菲爾德和貝雷爾森在著名的“伊里調(diào)查”中提出,他們發(fā)現(xiàn)觀念常常是從大眾觀點流向意見領袖,然后通過意見領袖發(fā)聲傳遞給不太活躍的人群,意見領袖在社會網(wǎng)絡中是活躍分子,處于核心地位[1]。在網(wǎng)絡教學平臺的支撐和支持下,虛擬學習社區(qū)蓬勃發(fā)展,已經(jīng)成為教育信息傳播和共享的重要途徑,為教師、學習者、管理者等提供了多種學習途徑,這些用戶可以自由、開放地發(fā)表觀點、討論、分享等,這一系列的互動方式最終形成了一個完整的社會網(wǎng)絡[2]。剖析虛擬學習社區(qū)成員的日常行為可以發(fā)現(xiàn),各類用戶主要通過個人學習、分享學習、交流學習、指導學習等方式獲取知識,其中意見領袖經(jīng)常可以通過直接或者間接的社會關系,對其他用戶的學習行為和學習習慣造成影響,促進在線知識的傳播,提升傳播的速度、廣度以及范圍[3]。對于虛擬學習社區(qū)的研究,主要從兩個方面進行分析。第一,以社區(qū)成員的行為特征為依據(jù),通過聚類算法分析成員的活躍程度、響應值、瀏覽量等得到社區(qū)的意見領袖群[4];第二,從復雜網(wǎng)絡的角度進行分析,衡量成員的中心性、特征屬性等識別出意見領袖[5]。文中將結(jié)合以上兩種思路,從社區(qū)拓撲結(jié)構和社會網(wǎng)絡角色兩方面提取特征,進行虛擬學習社區(qū)的意見領袖識別。

      1 虛擬學習社區(qū)網(wǎng)絡的拓撲結(jié)構

      1.1 構建虛擬學習社區(qū)網(wǎng)絡

      在虛擬學習社區(qū)中,用戶的社交行為主要有發(fā)帖、評論、轉(zhuǎn)發(fā)、關注等,其中最直接的相互作用方式為“關注|被關注”[6]。依據(jù)用戶間的關注關系構建用戶關系網(wǎng)絡G(V,E),其中V為網(wǎng)絡中節(jié)點的集合,v∈V表示虛擬學習社區(qū)中某一個用戶;E為有向邊集合,邊∈E表示該用戶a對用戶b存在關注行為,也可用“a→b”表示由用戶a指向被關注用戶b。虛擬學習社區(qū)用戶關系網(wǎng)絡是典型的有向網(wǎng)絡。

      1.2 用戶關系網(wǎng)絡的中心性分析

      由于社會網(wǎng)絡是復雜網(wǎng)絡中一個重要分支,因此社會網(wǎng)絡也具有復雜網(wǎng)絡的兩個重要特性,分別是小世界特性[7]和無尺度特性[8]。其中無尺度特性在社會網(wǎng)絡中普遍適用,具有成長性和優(yōu)先連接的特征,主要表現(xiàn)在社會網(wǎng)絡中新增節(jié)點趨向于與高連接的節(jié)點相連接,高連接的節(jié)點數(shù)量少,但是和網(wǎng)絡中大多數(shù)節(jié)點相聯(lián)系,這些節(jié)點被稱為節(jié)點中樞或集散節(jié)點[9]。在社會網(wǎng)絡中,進行節(jié)點的中心性度量,有助于識別網(wǎng)絡中的意見領袖,對于探索意見領袖的網(wǎng)絡位置和分析信息流傳播規(guī)律有重要的意義。常見的節(jié)點中心性度量方法包括:度中心性(degree centrality,DC)、介數(shù)中心性(betweenness centrality,BC)和特征向量中心性(eigenvector centrality,EC)。

      (1)度中心性。

      度中心性主要統(tǒng)計與該節(jié)點直接相鄰的其他節(jié)點的數(shù)目[10]。

      (1)

      其中,Cij表示社會網(wǎng)絡中節(jié)點j到節(jié)點i的權重值,可用轉(zhuǎn)發(fā)量、回帖量、評論量等進行衡量。節(jié)點的度最容易獲取,當某節(jié)點的度值越大,表明該節(jié)點參與的社交行為越多。在有向社會網(wǎng)絡中,節(jié)點的度可分為入度和出度,分別反映該節(jié)點被關注、關注其他用戶的數(shù)量。

      (2)介數(shù)中心性。

      衡量介數(shù)中心性的分式中,分子表示社會網(wǎng)絡中通過某個節(jié)點v的最短路徑的數(shù)量,分母表示網(wǎng)絡中所有最短路徑數(shù)[11]。

      (2)

      用戶節(jié)點的介數(shù)中心性反映了該用戶在社會網(wǎng)絡中是否處在樞紐位置,介數(shù)值越大,則表明有越多的最短路徑通過該用戶進行連接。介數(shù)值大的用戶對于網(wǎng)絡信息的傳播有重要的意義,這類用戶一旦被刪除,將會導致網(wǎng)絡直徑增大,信息傳播通路中斷。

      (3)特征向量中心性。

      特征向量中心性是從社會網(wǎng)絡整體的角度發(fā)掘具有全局性的核心用戶節(jié)點[12]。

      EC(u)=αmax(u)

      (3)

      有研究表明社會網(wǎng)絡中核心節(jié)點的鄰居節(jié)點比邊界節(jié)點的重要性更高。特征向量中心性就是通過統(tǒng)計該用戶的鄰居的重要程度,反襯出該用戶在社會網(wǎng)絡中的中心程度。

      文中選取入度、出度、介數(shù)、特征向量中心性作為評價用戶節(jié)點中心性的四個特征參數(shù),用于衡量虛擬學習社區(qū)用戶的重要性程度。

      2 基于K-means算法的意見領袖識別模型

      2.1 意見領袖的社會網(wǎng)絡角色分析

      在社會網(wǎng)絡中,眾多用戶之間存在著規(guī)則性的聯(lián)系,在拓撲結(jié)構上也具有相似性,依據(jù)用戶所處的社會網(wǎng)絡位置,可以對用戶的社會網(wǎng)絡角色進行劃分,主要包括:中心者、橋梁、邊緣者[13]。

      中心者處于社會網(wǎng)絡的核心位置,擁有更多的社會資源,聯(lián)系并影響著眾多其他用戶;中心者社會活躍度高,往往是社區(qū)輿論的發(fā)起者;中心者擁有較高的社會聲望,有能力對網(wǎng)絡信息的傳播和網(wǎng)絡環(huán)境的改變產(chǎn)生影響。

      橋梁處于結(jié)構洞位置,用于連接社會網(wǎng)絡中兩個毫無關系的用戶或者用戶群,起到中間人的角色,控制信息的傳遞,容易識別并獲取不同渠道或群體的信息資源,比其他位置上的用戶更具有競爭力。這一類用戶往往具有特殊的身份,如新聞評論員、微博大V、論壇管理員、聊天群群主等,對于輿論傳播和發(fā)展,有管理、識別、控制、引導等作用。

      邊緣者處于社會網(wǎng)絡的邊界位置,與其他用戶較少聯(lián)系。他們參與的網(wǎng)絡活動主要包括瀏覽信息、回復評論、關注用戶等,對于社會網(wǎng)絡信息的識別、傳播、控制的能力有限,社會影響力小。

      綜上所述,對于意見領袖的識別需要重點研究社會網(wǎng)絡中的中心者、橋梁這類用戶。

      2.2 社區(qū)用戶特征向量分析

      依照虛擬學習社區(qū)用戶關系網(wǎng)絡的拓撲特性以及社會網(wǎng)絡中意見領袖的角色特性,文中選取以下7個特征值作為篩選意見領袖的重要條件,并構建出用戶特征向量Ui={v1,v2,v3,v4,v5,v6,v7}。

      入度v1:表示其他用戶對于該用戶的關注數(shù)量,入度值的高低反映該用戶與其他用戶的交互情況,通常用來描述該用戶間交互的主動性與積極性。

      出度v2:表示該用戶關注其他用戶的數(shù)量,當一個用戶關注的人越多,獲取信息的能力就越強,對整個網(wǎng)絡的信息傳播有著重要意義。

      介數(shù)v3:介數(shù)常用來衡量網(wǎng)絡中某節(jié)點控制其他節(jié)點間交流的能力,通過比較其他節(jié)點的交流要通過該節(jié)點的次數(shù)來進行計算,可以有效地判別網(wǎng)絡中節(jié)點的全局重要性。

      特征向量中心性v4:特征向量中心性就是通過統(tǒng)計該用戶的鄰居用戶的重要程度,反襯出該用戶在社會網(wǎng)絡中的中心程度。

      用戶活躍度v5:用戶活躍度用來統(tǒng)計用戶發(fā)帖的數(shù)量。用戶活躍度越高,反映該用戶的社會行為比較頻繁,在對信息產(chǎn)生和傳播的數(shù)量上有一定的比重,在篩選意見領袖時用戶活躍度是一個關鍵的因素。

      用戶帖子轉(zhuǎn)發(fā)量v6:用戶帖子的轉(zhuǎn)發(fā)量可以直觀地反映信息的傳播情況。轉(zhuǎn)發(fā)量越大,說明該消息傳播范圍越廣,發(fā)起者的意見可以直接或間接地影響讀貼人對某一事件的看法,從而引發(fā)輿情的轉(zhuǎn)變。

      用戶帖子評論量v7:評論量的高低體現(xiàn)出話題的熱度。帖子評論量越高,說明該話題被其他用戶關注的越多,帖子本身質(zhì)量高并且更具有吸引力。

      2.3 基于K-means的用戶聚類算法

      聚類是一種無監(jiān)督的學習方式,包括劃分法、層次法、模糊聚類法等,通過設定判斷標準,把原數(shù)據(jù)集分割為多個單獨存在的簇,同一簇中數(shù)據(jù)相似性大,不同簇中數(shù)據(jù)差異性大[14]。文中采用的K-means算法是最著名的聚類算法之一,具有高效、復雜度低的特點。算法描述如下:

      輸入:樣本集D={x1,x2,…,xm},聚類的簇值k,最大迭代次數(shù)N

      構建初始簇集C={C1,C2,…,Ck},隨機選取k個樣本點作為初始中心點Q={q1,q2,…,qk};

      repeat

      計算樣本集D到中心點集Q的距離,劃分到各個簇中Ci(i∈[1,k]);

      重新計算各簇的中心點;

      until簇集C'無變化|迭代次數(shù)≥N

      輸出:簇集C'={C1,C2,…,Ck}

      2.4 虛擬學習社區(qū)意見領袖識別

      虛擬學習社區(qū)是教育信息化可持續(xù)發(fā)展的新途徑。在社區(qū)中,意見領袖處于重要的社會網(wǎng)絡位置,充當關鍵的社會網(wǎng)絡角色,掌握了大量的強聯(lián)結(jié)關系以及重要的弱聯(lián)結(jié)關系,對于建立穩(wěn)定的信息交流秩序和提高學習信息的傳播有重要的作用[15]。

      依據(jù)意見領袖的拓撲特性以及角色特性,文中設定意見領袖的篩選條件為:①簇成員數(shù)較小;②簇成員的特征向量Ui={v1,v2,v3,v4,v5,v6,v7}的均值較大[16];③簇成員具有特殊的社會網(wǎng)絡角色。

      意見領袖識別過程如下:首先利用K-means算法獲取聚類結(jié)果,簇集C'={C1,C2,…,Ck};然后選取成員數(shù)較小的簇作為備選意見領袖集合,再分別計算各備選集合中特征值{v1,v2,v3,v4,v5,v6,v7}的均值,并降序排列;最后分析均值最大的簇中各成員的社會網(wǎng)絡角色,最終得到意見領袖集合。具體過程如圖1所示。

      圖1 基于K-means算法的意見領袖識別模型

      3 虛擬學習社區(qū)中意見領袖識別實證研究

      3.1 實驗數(shù)據(jù)

      文中選取國內(nèi)某虛擬社區(qū)的用戶數(shù)據(jù)作為研究對象,該社區(qū)數(shù)據(jù)具有用戶多、特征量多、關系復雜等特點。采用Python語言編寫爬蟲工具,利用Scrapy突破反爬蟲機制,有效地提升爬取速度,對于該社區(qū)2018年6月1日至2018年12月31日的數(shù)據(jù)進行抓取,共爬取了49 996條關系信息,通過篩選得到40 231條用戶信息。文中分別計算每個社區(qū)用戶的特征值,構建用戶的特征向量,并將這些用戶的特征向量作為K-means算法的測試數(shù)據(jù)。典型的社區(qū)用戶特征向量數(shù)據(jù)如表1所示。

      表1 典型的社區(qū)用戶特征向量

      3.2 實驗結(jié)果驗證及分析

      文中采用K-means算法進行聚類分析,將用戶特征向量Ui中的7個特征值作為原始輸入數(shù)據(jù)。首先,選取DBI指數(shù)(Davies-Bouldin指數(shù))作為評價聚類優(yōu)劣的指標,進行聚類中心數(shù)的選取[14]。當DBI指數(shù)越小,所得到的聚類結(jié)果越好。如圖2所示,當k=6時,DBI值最小,選取6作為聚類中心數(shù)。

      圖2 K-means算法聚類中心數(shù)選取

      運行K-means算法程序,對輸入的用戶特征向量反復訓練和測試后,原始輸入數(shù)據(jù)被聚類為6個不同的子類,如表2所示。

      表2 社區(qū)用戶聚類情況

      分析社區(qū)用戶聚類結(jié)果,可見子類C4、C0中成員的個數(shù)較少,占整個社區(qū)用戶的比例分別為0.02%、0.07%,符合篩選條件的第一條,這兩個子類中必有一個子類能最大程度滿足意見領袖的特征需求。為了進一步篩選出最適合的意見領袖集合,對于6個子類中的成員,分別統(tǒng)計出特征值{入度v1,出度v2,介數(shù)v3,特征向量中心性v4}的均值,如表3所示。

      表3 子類特征值{v1,v2,v3,v4}的均值

      表3中,子類C4的特征值均值比其他子類更具有優(yōu)勢,其入度、出度的均值最高,說明C4成員與其他用戶間存在著大量的直接關注關系,其發(fā)表的言論會被其他用戶直接接收,容易產(chǎn)生強大的影響力;介數(shù)均值遠高于其他用戶,說明C4成員是信息交流過程中的重要通路,控制著信息的流動;特征向量中心性高,說明C4成員在社會網(wǎng)絡全局角度也具有很強的重要性。綜上所述,子類C4中的社區(qū)用戶比其他用戶更具有意見領袖的特征。

      經(jīng)過調(diào)查分析,子類C4中7位用戶的社會網(wǎng)絡角色均為中心者或者橋梁(如表4),其中1、2、3、4、7號用戶是該社區(qū)的資深會員,5、6號用戶擔任過版主,符合篩選條件的第三條。經(jīng)過以上分析,說明子類C4是該社區(qū)的意見領袖集合,其中7位成員均為意見領袖。

      表4 子類C4中用戶的社會網(wǎng)絡角色

      3.3 虛擬學習社區(qū)中意見領袖的作用

      通過驗證分析,發(fā)現(xiàn)社會網(wǎng)絡中意見領袖多處于中心者或橋梁位置,占據(jù)著社會網(wǎng)絡的優(yōu)勢位置。意見領袖通常具備豐富的學識、廣闊的視野、先進的教育理念和專業(yè)的分析能力等,掌握更多的教育資本,可以將擁有的教學信息分享給其他用戶,提供更多的課程資料,擴充社區(qū)的學習資源。通過意見領袖專業(yè)的信息加工和解釋,可以有效地降低用戶的理解難度,開拓視野,促進用戶的專業(yè)發(fā)展。意見領袖并不是以獨立個體的形式存在,他們是具有相似的社會網(wǎng)絡拓撲特征和角色特征的用戶集合。在虛擬學習社區(qū)的可持續(xù)發(fā)展中,應該充分利用意見領袖集合對整個社區(qū)的影響力,協(xié)調(diào)社區(qū)中的各種資源,發(fā)揮其輿論引導能力,有效地控制社區(qū)中信息流動,營造良好的學習氛圍,促進社區(qū)的自我組織和良性成長。

      4 結(jié)束語

      從社會網(wǎng)絡拓撲結(jié)構角度,提取入度、出度、介數(shù)、特征向量中心性等特征參數(shù),結(jié)合社會網(wǎng)絡角色特性,得到社區(qū)用戶特征向量,作為識別意見領袖的重要標準之一,通過K-means聚類算法并結(jié)合意見領袖的篩選條件,提出基于K-means算法的意見領袖識別模型。通過實例驗證,獲取的意見領袖集合具有很高的準確性,集合中各成員的社會網(wǎng)絡位置和角色均符合意見領袖的特點。意見領袖群體注重各個領域間的融合,促使學習資源由單一的實用性轉(zhuǎn)向多元化發(fā)展;引導用戶利用閑暇時間學習,滿足用戶的日常學習需求;打破師生間時空分離的學與教,注重用戶學習間的協(xié)作與共享。意見領袖以特殊的社會網(wǎng)絡角色,促進大數(shù)據(jù)、人工智能等新技術與在線學習有效結(jié)合,推動虛擬學習社區(qū)的可持續(xù)發(fā)展。

      猜你喜歡
      特征向量領袖聚類
      二年制職教本科線性代數(shù)課程的幾何化教學設計——以特征值和特征向量為例
      領袖風范
      黃河之聲(2022年6期)2022-08-26 06:46:04
      咱們的領袖毛澤東
      克羅內(nèi)克積的特征向量
      一類特殊矩陣特征向量的求法
      基于DBSACN聚類算法的XML文檔聚類
      電子測試(2017年15期)2017-12-18 07:19:27
      EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗上的應用
      中華建設(2017年1期)2017-06-07 02:56:14
      領袖哲學
      基于改進的遺傳算法的模糊聚類算法
      平民領袖
      准格尔旗| 江山市| 南溪县| 富顺县| 诏安县| 哈密市| 洛南县| 太仓市| 屏山县| 安溪县| 西藏| 宝清县| 福泉市| 新河县| 内乡县| 长海县| 保靖县| 富蕴县| 公主岭市| 南漳县| 萨嘎县| 科技| 任丘市| 福建省| 炉霍县| 璧山县| 罗江县| 岳普湖县| 淳安县| 抚松县| 鄂尔多斯市| 阜阳市| 呼和浩特市| 右玉县| 丰台区| 凯里市| 五莲县| 岳西县| 偏关县| 新竹市| 祁阳县|