[摘要]從中國農業(yè)網站排行篩選出有代表性的25個農業(yè)網站,確定網頁總數、總鏈接數、外鏈接數、內鏈接數、網絡影響因子、外部網絡影響因子、內部網絡影響因子、PR值共8個分析指標,運用鏈接分析法對這些中國農業(yè)網站的網絡影響力進行分析,然后通過灰色關聯度分析法對網站進行排序,最后根據統(tǒng)計結果分析中國農業(yè)網站建設的成績和不足。
[關鍵詞]中國農業(yè)網站 網絡影響力 鏈接分析法 灰色關聯度分析
農業(yè)信息化是國民經濟和社會信息化的重要組成部分,以農業(yè)信息化帶動農業(yè)現代化,對于促進國民經濟和社會持續(xù)協調發(fā)展具有重大意義。農業(yè)信息網站在農業(yè)信息化建設中扮演著重要的角色,并成為體現中國農業(yè)信息化進程的重要標志。中國互聯網絡信息中心發(fā)布的《第30次中國互聯網絡發(fā)展狀況調查統(tǒng)計報告》指出:截至2012年6 月底,農村網民規(guī)模為1.46億,比2011年底增加1 464萬 [1]。中國電子商務研究中心發(fā)布的《2009年1-8月農業(yè)網站發(fā)展趨勢分析報告》也指出:農業(yè)網站的站點數目僅在2009年1-8月期間就有著顯著的增長,總數達到29 739家,8個月內增加了8 183家,增長率達到38.0%,遠遠高于全國互聯網站平均增長速度[2]。因此,對相關農業(yè)網站網絡影響力的分析就具有了非常現實的意義。
所謂鏈接分析法,就是運用網絡數據庫、數據分析軟件等工具,利用統(tǒng)計學、拓撲學和情報學方法,對網站的網絡鏈接自身屬性、鏈接對象、鏈接網絡等進行分析,以便揭示其數量特征和內在規(guī)律,用以解決網站存在的某些方面問題的一種研究方法。鏈接分析是引文分析在網絡環(huán)境中的應用,是網絡計量分析的核心方法,在網絡信息組織、檢索、評價、服務等方面發(fā)揮著重要作用 [3]。
1 研究方法
1.1 研究對象
本文選取了中國農業(yè)網站排行(http://top.chinabreed.com)提供的農業(yè)網站排名,選取排名靠前且較為穩(wěn)定的網站作為研究對象。中國農業(yè)網站排行有日排名百強、周排名百強、月排名百強、綜合排名百強,本文選擇了綜合排名百強作為原始數據,選擇排名靠前且較為穩(wěn)定的網站作為研究對象。同時綜合排名百強中有一些農業(yè)高校的網站,考慮到這些網站不能算嚴格意義上的農業(yè)網站,因此未列入樣本范圍。另外,中國畜牧業(yè)信息網、中國玉米網由于總鏈接數和外部鏈接數及內部鏈接數之和差異太大,推斷和搜索引擎本身鏈接分析功能不穩(wěn)定有關,因此這兩個網站也未被列入研究范圍,最終筆者選擇了25個農業(yè)網站作為研究樣本,相關網站的名稱和網址如表1所示:
1.2 研究工具
目前國內用于鏈接分析研究的工具,主要有具備鏈接分析功能的商業(yè)搜索引擎和自主開發(fā)的網絡爬行軟件。國內研究者開發(fā)的網絡爬行軟件大多針對特定需求開發(fā),因此功能有限,適用范圍較小,而且很難獲得。國外研究者開發(fā)的網絡爬行軟件盡管功能較強且相對通用,但一些軟件對中文網頁的處理能力還有待提高。商業(yè)搜索引擎的應用較為廣泛,主要有AltaVista、Alltheweb、Google、Bing等。其中Alltheweb已經被Yahoo關閉,AltaVista用于鏈接分析較多,但自從AltaVista被Yahoo兼并后其鏈接分析功能基本處于不可用的狀態(tài)。經過反復比較實驗,筆者選取穩(wěn)定性和一致性較好的Google(http://www.google. com.hk/)作為研究工具。考慮到中文谷歌搜索引擎近期調整幅度較大,在采集相關數據時同時使用英文版Google輔助搜索,增加原始數據的準確性。
1.3 研究指標及檢索方法
本文選取了8個研究指標:①網頁總數(WP)。某網站所擁有的網頁數越多,信息含量越大,這一指標在一定程度上反映了網站的規(guī)模。②鏈接總數(TL)。指應用搜索引擎搜索到的與某網站存在鏈接的網頁總數,它反映了該網站被鏈接的總量大小,是網站網絡影響力的主要標志。③外鏈接數 (EL)。指應用搜索引擎針對某網站范圍外搜索得到的與該網站存在鏈接的數量,即這些鏈接網頁均來自該網站以外的網頁。一般認為它比總鏈接數能更好地反映網站的外部影響力,體現了網站的建設質量和網站間的關系。④內鏈接數(SL)。指同一網站主域名下的內容頁面之間互相鏈接,它反映網站內部結構的層次性與完備性以及相關信息的整合水平。⑤網絡影響因子(WIF。WIF=TL/WP,反映網站網頁被鏈接的平均水平,WIF越高,網站的影響力越大。⑥外部網絡影響因子(WIFe)。WIFe= EL/WP,反映網站網頁被外部鏈接的平均水平,它有利于提高網站的訪問量,提升網站在搜索引擎中的排名。⑦內部網絡影響因子(WIFs)。WIFs=SL/WP,反映了網站網頁自我鏈接的平均水平。合理的內部鏈接部署可以提升網站的搜索引擎優(yōu)化 (SEO)的效果。⑧PR值。它是Google用于標識網頁的等級、重要性的一種方法,是Google用來衡量一個網站的好壞的重要標準之一。級別從1到10級,10級為滿分。PR值越高,說明該網頁越受歡迎或越重要。
筆者通過Google(http://www.google.com.hk/)來獲取各農業(yè)網站的鏈接原始數據,再利用Excel 進行數據的整理和分析。以中國養(yǎng)殖網為例,其檢索式見表2。PR值的獲取,通過“站長工具”網站(http://tool.chinaz.com)中的PR查詢功能獲得。各原始數據的檢索時間為2012年7月23日。
2 數據處理與結果
2.1 中國農業(yè)網站樣本鏈接分析數據
通過上述工具及檢索方法,共獲得25個中國農業(yè)網站的鏈接分析數據,如表3所示:
2.2 灰色關聯度分析
一般來說,以上7個鏈接分析指標數值越大,說明該政府網站的自身結構完備性、網站影響力以及網站輻射力越強,其PR值越高,說明該網站在搜索引擎排名中的地位越重要。但從表3中各指標的結果來看,由于每項指標的排序都有所不同,從總體上難以對各農業(yè)網站的影響力進行綜合分析與評價,因此本文通過灰色關聯度分析方法對25個農業(yè)網站的8個指標進行綜合排名。
灰色系統(tǒng)理論是由著名學者鄧聚龍教授首創(chuàng)的一種系統(tǒng)科學理論,其應用涉及社會科學和自然科學的各個領域,尤其在社會經濟領域,達到較好的應用效果。其中的灰色關聯分析是指對一個系統(tǒng)發(fā)展變化態(tài)勢的定量描述和比較的方法,其基本思想是通過確定參考數據列和若干個比較數據列的幾何形狀相似程度來判斷其聯系是否緊密。具體步驟如下:①確定分析數列。確定反映系統(tǒng)行為特征的參考數列和影響系統(tǒng)行為的比較數列。②變量的無量綱化。系統(tǒng)中各因素列中的數據可能因量綱不同難以比較,因此一般都要進行數據的無量綱化處理。③計算關聯系數。ρ稱為分辨系數,一般ρ的取值區(qū)間為(0,1),具體取值可視情況而定,通常取ρ=0.5。④計算關聯度。因為關聯系數不止一個,不便于進行整體性比較。因此有必要將各個時刻的關聯系數集中為一個值,求其平均值。⑤關聯度排序。關聯度按大小排序,在算出Xi(k)序列與Y(k)序列的關聯系數后,計算各類關聯系數的平均值,平均值ri就稱為Y(k)與Xi(k)的關聯度。
依據以上方法,中國農業(yè)網站樣本關聯度排序結果如表4所示:
3 結果分析
通過以上結果可以看出,中國農業(yè)網站建設取得了一定的成績,本文樣本盡管只選取了部分農業(yè)網站,但可以發(fā)現這些農業(yè)網站覆蓋到中國農業(yè)的多個方面,既有綜合性的網站如農博網、中國農業(yè)信息網、中國農業(yè)網(北京)、中國農業(yè)網(杭州),也有專注于某一農業(yè)領域的網站如中國養(yǎng)殖網、中國豬e網、中國水產養(yǎng)殖網等。盡管各農業(yè)網站網頁總數和總鏈接數有一定的差別,但絕大多數均達到了一定的規(guī)模。網站組織雖然內容各異,但都包含了農業(yè)信息、農村服務、電子商務等基本模塊,有些農業(yè)網站針對自身的特點還有一些特色版塊,總體上中國農業(yè)網站內容較為豐富,結構較為完整,對于推動我國農業(yè)信息化建設起到了重要積極的作用。
但同時各農業(yè)網站也存在著一些不足。以各網站網頁總數為例,網頁總數在10萬以上的網站有7個:中國豬e網、中國水產養(yǎng)殖網、農博網、豬價格網、養(yǎng)殖商務網、中國飼料行業(yè)信息網、中國農業(yè)網(北京),其中中國農業(yè)網(北京)網頁總數最多,為548 000個。網頁總數在1-10萬之間的政府網站有14個:易菇網、中國水產門戶網、盛世金農網、愛畜牧、畜牧人、中國農業(yè)信息網、中國養(yǎng)殖網、中華糧網、中農網、中國禽病網、三農直通車、天下糧倉、中國農業(yè)網(杭州)、豬場動力網。網頁總數在1萬以下的網站有4個:中國葡萄網、中國水產網、山東三農網、巨農網。中國葡萄網網頁總數最少為1 890個。總體上呈現一種“中間大兩頭小”的分布,由于各農業(yè)網站地域分布的不均衡性以及各區(qū)域農業(yè)信息化建設發(fā)展水平不同,體現在各農業(yè)網站建設程度上也存在一定的差異。
外鏈接數中,10萬以上的僅農博網1個網站,鏈接數為259 000,一定程度上體現了農博網作為國家農村信息服務示范項目具有較強的網絡輻射力。外鏈接數在1-10萬之間的網站有14個:山東三農網、中國禽病網、盛世金農網、中國飼料行業(yè)信息網、豬價格網、中國農業(yè)信息網、中國養(yǎng)殖網、中華糧網、天下糧倉、愛畜牧、中國豬e網、中國農業(yè)網(北京)、中國水產養(yǎng)殖網、三農直通車。外鏈接數在1萬以下的農業(yè)網站共10個:豬場動力網、中國葡萄網、巨農網、中農網、中國水產網、中國水產門戶網、易菇網、養(yǎng)殖商務網、中國農業(yè)網(杭州)、畜牧人。外鏈接數在1萬以下的網站占到網站總數的40%,說明我國農業(yè)網站的外部影響力相對較低。
各農業(yè)網站的內鏈接數分布也有較大的差異,內鏈接數超過10萬的網站僅2個:農博網最高,為590 000,豬價格網為241 000。內鏈接數在1-10萬之間的網站有13個:中農網、中國禽病網、豬場動力網、中國養(yǎng)殖網、養(yǎng)殖商務網、盛世金農網、天下糧倉、中華糧網、中國農業(yè)信息網、中國豬e網、中國飼料行業(yè)信息網、中國水產養(yǎng)殖網、中國農業(yè)網(北京)。內鏈接數在1 000-10 000之間的農業(yè)網站有8個:中國水產門戶網、山東三農網、三農直通車、巨農網、畜牧人、易菇網、中國農業(yè)網(杭州)、愛畜牧。內鏈接數在1 000以下的農業(yè)網站僅2個:中國葡萄網、中國水產網。內鏈接數較低說明它們的網站內部結構還不合理,層次性和完備性還有待提高。對于這些網站,除了要豐富網站內容,提供更多的農業(yè)信息給用戶外,還要優(yōu)化其站內鏈接,使得內部層級結構更為合理,為用戶訪問和瀏覽提供更大的方便,從而提高自身的網絡影響力。
僅從數據來看,網絡影響因子最高的為巨農網,其值為3.2765,但這一數據的準確性不高,因為其網頁總數為5 280,總鏈接數為17 300,均不算高。這主要和搜索引擎對該網站收錄較少有關,說明該網站應該強化SEO(搜索引擎優(yōu)化),增加被搜索引擎收錄的網頁,提高搜索引擎排名,從而提高網站訪問量提升網站的影響力。網絡影響因子在2-3之間的農業(yè)網站共有7個:中國養(yǎng)殖網、盛世金農網、愛畜牧、山東三農網、農博網、中國禽病網、三農直通車。山東三農網盡管影響因子高達2.2594,但和巨農網相同,其網頁總數和總鏈接數均不高。其余網站網絡影響因子較高,在一定程度上體現了這些網站在農業(yè)網站中具備較高的影響力。網絡影響因子在1-2之間的網站共有9個:易菇網、豬價格網、中農網、畜牧人、中國農業(yè)信息網、中國水產網、中國豬e網、中華糧網、天下糧倉。網絡影響因子在1以下的網站共有8個:豬場動力網、養(yǎng)殖商務網、中國農業(yè)網(杭州)、中國葡萄網、中國水產門戶網、中國農業(yè)網(北京)、中國水產養(yǎng)殖網、中國飼料行業(yè)信息網??梢姀恼w上看中國農業(yè)網站整體影響力還不夠高,較有影響的網站其網絡影響因子也不過在2-3之間。網絡影響因子在1以下的網站占到近1/3,這些網站應該采取多種措施提升網絡影響力。
在關聯度排序中,沒有1家農業(yè)網站達到較高的0.9-1的區(qū)間,最高的為農博網,也僅為0.7451,其余均在0.3-0.6之間,而且彼此間差別不大,體現出中國農業(yè)網站網絡輻射力不高,網絡影響力整體偏低。這一結果和目前我國農業(yè)網站中普遍存在的規(guī)?;蛯I(yè)化程度較低、服務內容同質化等問題相互驗證。除了少數較有影響的農業(yè)網站外,一些農業(yè)網站建設水平不高,網站內容重復,網站欄目設置雷同。
另外,農業(yè)網站的PR值在6以上的網站共2個:中國豬e網、中國農業(yè)信息網。PR值在5-6之間的網站共17個:中國養(yǎng)殖網、中國水產養(yǎng)殖網、中國禽病網、愛畜牧、豬價格網、中國水產門戶網、山東三農網、畜牧人、豬場動力網、中國飼料行業(yè)信息網、中國農業(yè)網(北京)、天下糧倉、中農網、中國農業(yè)網(杭州)、中國水產網、中華糧網、三農直通車。PR值在2-4之間的網站共6個:盛世金農網、農博網、易菇網、養(yǎng)殖商務網、巨農網、中國葡萄網。顯示中國農業(yè)網站在搜索引擎中排名偏低,要提升網站的影響力,除了提高自身內容的質量外,網站的宣傳推廣也必不可少,建議增加更多的友情鏈接,因為友情鏈接有助于提高網站在Google中的排名,提升網站在搜索引擎中的可見度。
參考文獻:
[1] 中國互聯網絡信息中心.第30次中國互聯網絡發(fā)展狀況調查統(tǒng)計報告[EB/OL].[2012-07-25].http://www.cnnic. net.cn/dtygg/dtgg/201207/t20120719_32230.html
[2] 中國電子商務研究中心.2009年1-8月農業(yè)網站發(fā)展趨勢分析報告[EB/OL]. [2012-07-25]. http://b2b.toocle. com/detail--4769627.html
[3] 黃微,李吉,王文韜.基于鏈接分析法的我國省級知識產權局網站的網絡影響力分析[J].情報科學,2012(2):264-267.
[作者簡介] 許劍穎,男,1973年生,講師,碩士,研究方向為信息計量學,發(fā)表論文10余篇。