中國電信廣東無線網(wǎng)絡(luò)中心 高俊敏 冼 健 陸偉雄
隨著新增資源的入網(wǎng)、基礎(chǔ)維護(hù)的夯實、精細(xì)化運(yùn)營的深化,現(xiàn)階段CDMA網(wǎng)絡(luò)的容量及覆蓋已日益完善,網(wǎng)絡(luò)質(zhì)量、用戶滿意度也得到了明顯的提高。然而,在移動通信市場競爭日益激烈的背景下,如何進(jìn)一步提升網(wǎng)絡(luò)質(zhì)量和用戶感知,成為運(yùn)營商的重要任務(wù)。
負(fù)荷分擔(dān)類業(yè)務(wù)是指系統(tǒng)中使用兩個或兩個以上的模塊并行實現(xiàn)相同的功能,各模塊分?jǐn)偟臉I(yè)務(wù)量可以相同或不同。當(dāng)某一模塊出現(xiàn)故障時,其分?jǐn)偟臉I(yè)務(wù)量可由其他正常工作的模塊承接而不影響系統(tǒng)的正常運(yùn)行。負(fù)荷分擔(dān)模型在通信系統(tǒng)中有極為普遍的應(yīng)用:從網(wǎng)絡(luò)到終端、設(shè)備到傳輸、信令和業(yè)務(wù)各個維度都有負(fù)荷分擔(dān)模型的應(yīng)用。
負(fù)荷分擔(dān)類主要有以下優(yōu)點:
⊙ 提高系統(tǒng)的可靠性:如果負(fù)荷分擔(dān)的某一部分出現(xiàn)故障,其他部分可以接替它的工作。
⊙ 提高資源的利用率:負(fù)荷分擔(dān)能節(jié)約部分備用的資源,減少熱備份帶來的資源浪費(fèi)。
⊙ 系統(tǒng)擴(kuò)容簡單方便:可以通過增加并行的功能模塊進(jìn)行擴(kuò)容而不影響業(yè)務(wù)的正常運(yùn)營。
⊙ 提高用戶的感知度:負(fù)荷分擔(dān)類業(yè)務(wù)發(fā)生故障時通信不會完全中斷,因此用戶感知較好。
⊙ 可提供差異化服務(wù):可以根據(jù)不同的用戶具體需求使用不同質(zhì)量的模塊提供差異化服務(wù)。
本文研究的重點側(cè)重于在移動通信網(wǎng)絡(luò)層面用戶感知的改善,因此,下文的用戶感知都在網(wǎng)絡(luò)層面上討論,而不涉及到用戶終端、費(fèi)用等其他因素。
首先我們按語音和數(shù)據(jù)進(jìn)行區(qū)分,并從“業(yè)務(wù)接入、業(yè)務(wù)保持和業(yè)務(wù)質(zhì)量”三個維度進(jìn)行分解,然后再將以上三個維度細(xì)化成可量化的網(wǎng)絡(luò)指標(biāo)。
我們將用戶感知在兩個層面上進(jìn)行劃分:全網(wǎng)總體用戶感知和特定客戶群的用戶感知。前者是全局、宏觀的概念,后者是比較局部、微觀的概念,其重要性也不能忽視,尤其是重要客戶群(如黨政軍、教育、醫(yī)療等重要業(yè)務(wù)的客戶群)。
針對全網(wǎng)總體用戶感知,我們采取統(tǒng)計學(xué)的方法,通過問卷和實驗等方式進(jìn)行用戶調(diào)查,確定每一個指標(biāo)的權(quán)重,最終建立了簡化的用戶感知算法模型,如表1所示。
表1 全網(wǎng)總體用戶感知算法模型
由于特定客戶群的微觀屬性,某一特定客戶群對各個指標(biāo)的敏感性可能不同于其他客戶群,其在指標(biāo)相同的前提下對各個維度的主觀評分也有所不同。因此,在考慮特定客戶群的用戶感知時,需明確該特定客戶群的特點,然后根據(jù)其特點進(jìn)行具體分析,有針對性地提高其用戶感知。比如我們可以根據(jù)用戶對指標(biāo)的敏感性將客戶劃分為“速率導(dǎo)向型”、“業(yè)務(wù)可用率導(dǎo)向型”、“掉線率導(dǎo)向型”等類型的客戶群,根據(jù)業(yè)務(wù)重要性將客戶劃分“VIP客戶群”和“普通客戶群”,或者根據(jù)流量將客戶劃分為“高流量客戶群”、“中等流量客戶群”、“低流量客戶群”。然后根據(jù)特定客戶群確定不同網(wǎng)絡(luò)指標(biāo)的主觀評分標(biāo)準(zhǔn)和權(quán)重,建立特定的用戶感知模型。
提高用戶感知,需要做好系統(tǒng)規(guī)劃和系統(tǒng)維護(hù)兩方面的工作。
系統(tǒng)規(guī)劃必須以用戶感知的保障為導(dǎo)向,具體規(guī)劃中需注意的問題如下:
⊙ 資源利用率和系統(tǒng)可靠性的綜合考慮?!?橫向和縱向的負(fù)荷平衡。
⊙ 并聯(lián)的模塊物理上相分離。
⊙ 合理進(jìn)行差異化服務(wù)。
⊙ 根據(jù)模塊質(zhì)量進(jìn)行動態(tài)選擇,優(yōu)先選擇質(zhì)量較好的模塊。
下面將根據(jù)以上五個要素進(jìn)行闡述:
(1)資源利用率和系統(tǒng)可靠性的綜合考慮。每個模塊的利用率規(guī)劃需適當(dāng),過小則資源得不到充分利用,過大則系統(tǒng)可靠性得不到保證。
下面將用一個簡單的模型說明資源利用率與系統(tǒng)可靠性的關(guān)系,假設(shè)某負(fù)荷分擔(dān)系統(tǒng)滿足以下約束條件:
⊙ 為i個模塊并聯(lián)組成。
⊙ 各模塊的處理能力一致。⊙ 且負(fù)荷完全均衡。
⊙ 各模塊故障率相等。
設(shè)系統(tǒng)的實時處理速率為Pt(sys),每個模塊的最大處理能力為P(sub),各模塊的實時數(shù)據(jù)處理速率為Pt(sub)= Pt(sys)/i,則故障率與資源利用率(負(fù)荷百分比)的關(guān)系如表2。
表2 故障率與資源利用率的關(guān)系
為了直觀看出系統(tǒng)業(yè)務(wù)量位于峰值階段時故障率與資源利用率的關(guān)系,下面套用數(shù)據(jù)進(jìn)行展示(假定系統(tǒng)峰值業(yè)務(wù)量P(sys)=100,單模塊處理速率為30,單板故障率=0.5,不隨模塊負(fù)荷而變化)。
表3 峰值時故障率與資源利用率的關(guān)系
從表3中可以看出模塊的負(fù)荷減少時,即資源利用率下降時,系統(tǒng)故障率隨其成正相關(guān)下降,即系統(tǒng)通過犧牲資源利用率來換取故障率的降低。我們希望資源利用率不能太低,同時又希望系統(tǒng)故障率不能太高,這兩者是一組矛盾,在系統(tǒng)設(shè)計時要在綜合考慮兩者的平衡,以保證業(yè)務(wù)可用率達(dá)到用戶在業(yè)務(wù)保持維度上的要求。
為了進(jìn)一步探究托伐普坦對心衰患者長期預(yù)后的影響,本研究對所有納入的患者進(jìn)行為期24個月的隨訪,比較兩組患者的平均住院時間、心衰再住院率、非致死性心梗發(fā)生率、心血管死亡率及全因死亡率。結(jié)果發(fā)現(xiàn),托伐普坦組的平均住院時間和心衰再住院率均低于標(biāo)準(zhǔn)治療組(P<0.05),但兩組患者的非致死性心梗發(fā)生率、心血管死亡率及全因死亡率差異無統(tǒng)計學(xué)意義。Vaduganathan等[14]發(fā)現(xiàn),托伐普坦對血清滲透壓的影響在出院后4~8周逐漸下降,52周內(nèi)完全消失,因此托伐普坦不能改善患者的長期預(yù)后可能與短期(僅在住院期間)使用有關(guān)。研究[18-19]發(fā)現(xiàn),使用托伐普坦1年以上的心衰患者再入院率可能會下降。
需強(qiáng)調(diào)的是,如果模塊在超負(fù)荷工作時會引起退服的情況,那么當(dāng)模塊數(shù)量等于4時,一旦有一個模塊發(fā)生故障,其負(fù)荷分?jǐn)偟搅硗?個模塊上面,各模塊負(fù)荷變?yōu)?11.11%,即各模塊出現(xiàn)連鎖效應(yīng),依次癱瘓至整個系統(tǒng)崩潰。所以在系統(tǒng)設(shè)計時尤其要避免系統(tǒng)負(fù)荷處于連鎖反應(yīng)的臨界點,以防單模塊故障引發(fā)連鎖反應(yīng)。即使系統(tǒng)負(fù)荷達(dá)到一定門限值能夠停止新業(yè)務(wù)的接入,在設(shè)計時仍然需要考慮盡量規(guī)避連鎖反應(yīng),因為限制新業(yè)務(wù)接入將影響呼建成功率/連接成功率,從而影響用戶在業(yè)務(wù)接入維度上的感知。
(2)橫向和縱向的負(fù)荷平衡。橫向上,相同功能的各個模塊之間的負(fù)荷如果不平衡,可能出現(xiàn)個別模塊的負(fù)荷成為系統(tǒng)容量的瓶頸;縱向上,串聯(lián)實現(xiàn)不同功能的模塊之間的負(fù)荷如果不平衡,同樣可能出現(xiàn)個別模塊的負(fù)荷成為系統(tǒng)容量的瓶頸。一旦某個模塊出現(xiàn)擁塞,將可能影響用戶的“連接成功率/呼建成功率、業(yè)務(wù)可用率”,從而影響用戶在業(yè)務(wù)接入和業(yè)務(wù)保持維度上的感知。
(3)并聯(lián)的模塊物理上相分離。承擔(dān)相同業(yè)務(wù)的模塊盡量在物理上分離開來,如不同模塊走不同路由、掛接到不同的動力系統(tǒng)等。在相同的資源配置數(shù)量下,如果能對物理分離進(jìn)行合理規(guī)劃,可以大幅度提高系統(tǒng)的業(yè)務(wù)可用率,從而提高用戶在業(yè)務(wù)保持維度上的感知。
(4)合理進(jìn)行差異化服務(wù)。由于不同用戶對系統(tǒng)可靠性要求不同,部分重要業(yè)務(wù)(如金融系統(tǒng)業(yè)務(wù)、醫(yī)療業(yè)務(wù)等)明顯高于其他一般的業(yè)務(wù);另一方面,負(fù)荷分擔(dān)的并行模塊之間,穩(wěn)定性和質(zhì)量也可能存在差異。因此,可以將VIP客戶的業(yè)務(wù)承載在質(zhì)量好、穩(wěn)定性高的模塊上;同時,當(dāng)資源不足時,可優(yōu)先為VIP客戶分配資源。在相同的資源和系統(tǒng)故障率下,如果能適當(dāng)考慮不同客戶群對網(wǎng)絡(luò)要求的差異性,對業(yè)務(wù)的承載進(jìn)行合理規(guī)劃,可以提高總體的用戶感知。
(5)根據(jù)模塊質(zhì)量進(jìn)行動態(tài)選擇,優(yōu)先選擇質(zhì)量較好的模塊。由于不同模塊可能存在質(zhì)量的差異,如時延、穩(wěn)定性、丟包率、誤碼率等差異。在系統(tǒng)設(shè)計過程中,如能加入質(zhì)量實時監(jiān)測反饋機(jī)制并實現(xiàn)業(yè)務(wù)在不同質(zhì)量模塊之間的動態(tài)指配,優(yōu)先將業(yè)務(wù)指配到質(zhì)量較好的模塊上,可以優(yōu)化網(wǎng)絡(luò)在業(yè)務(wù)接入、業(yè)務(wù)保持和業(yè)務(wù)質(zhì)量三個維度上的指標(biāo),從而提高總體的用戶感知。
在負(fù)荷分擔(dān)類業(yè)務(wù)故障的處理中,要時刻以用戶感知的保障為導(dǎo)向。具體需注意的問題如下:
(1)調(diào)整資源,提高資源利用率。故障出現(xiàn)后,部分模塊不能正常服務(wù),如果不能快速修復(fù),應(yīng)考慮將故障模塊所占用的資源釋放出來,避免系統(tǒng)擁塞引起“連接成功率/呼建成功率”、“業(yè)務(wù)可用率”、“丟包率”等指標(biāo)惡化,從而對用戶感知產(chǎn)生影響。
(3)優(yōu)先處理承載VIP業(yè)務(wù)的模塊。由于不同用戶對系統(tǒng)可靠性要求不同,在故障處理中要盡量優(yōu)先處理承載VIP業(yè)務(wù)的模塊;緊急情況下,需考慮是否將運(yùn)行正常的模塊的資源調(diào)配給VIP業(yè)務(wù)使用。
【案例1】 Abis接口物理上分離的設(shè)計案例
中興CDMA的Abis接口大部分采用E1連接方式,早期基站的8條E1電路都由單塊SDTB板、ABPM板承載,并且同單一的匯聚光端機(jī)對接。因此,某一SDTB,ABPM或匯聚光端機(jī)出現(xiàn)故障時,可能導(dǎo)致該SDTB下掛的十幾個基站同時掉站。為了規(guī)避這種風(fēng)險,后期在Abis接口的設(shè)計上做出改進(jìn),將基站的8路E1電路從物理上分離:由不同的匯聚光端機(jī)、SDTB板、ABPM承載,如圖1所示。改進(jìn)后的系統(tǒng)規(guī)避了單一SDTB,ABPM或匯聚光端機(jī)故障導(dǎo)致大規(guī)模掉站的風(fēng)險,系統(tǒng)安全性得到大幅度提高,掉站率明顯降低,業(yè)務(wù)可用率得到提升。
圖1 改進(jìn)前后的連接示意圖
該案例是通過將并聯(lián)的模塊物理上相分離,避免由于某個模塊故障導(dǎo)致業(yè)務(wù)中斷,從而保證業(yè)務(wù)可用率,提高了用戶在“業(yè)務(wù)保持”維度上的感知。
【案例2】 中斷故障模塊的業(yè)務(wù)指配,優(yōu)化連接成功率和掉線率
目前,中興ZXSDR系列設(shè)備的E1電路指配機(jī)制存在一定缺陷,在檢測到某路E1誤碼時仍然會指配該電路,導(dǎo)致的結(jié)果是掉線率和連接成功率的惡化,進(jìn)而影響用戶感知。2012年7月18日,古巷長美基站出現(xiàn)“誤碼高”(第7路2m電路)告警。后臺觀察發(fā)現(xiàn)指標(biāo)明顯惡化。具體影響請見表4。
表4 電路故障前后指標(biāo)對比
對比發(fā)現(xiàn),E1故障不僅對連接成功率和掉線率影響明顯,還對DO流量的吸收產(chǎn)生較大影響。
由于該站物業(yè)問題未能及時上站修復(fù)電路,為了避免故障電路對業(yè)務(wù)產(chǎn)生的影響,只能先在后臺刪除故障電路。刪除該電路后,網(wǎng)絡(luò)指標(biāo)恢復(fù)正常。指標(biāo)請見表5。
表5 電路刪除前后指標(biāo)對比
該案例是通過調(diào)整業(yè)務(wù)分配策略,中斷質(zhì)量較低的模塊的服務(wù),從而改善了“掉線率/掉話率”和“連接成功率/呼建成功率”等指標(biāo),提升了用戶在業(yè)務(wù)接入、業(yè)務(wù)保持維度上的感知。
【案例3】 調(diào)整業(yè)務(wù)分配策略,保證各模塊的負(fù)荷平衡
目前,廣東CDMA的中興區(qū)BSC的部分DO協(xié)議處理板SDU板沒有采用主備,潮州市每個DO信令處理模塊DOCMP都下掛2塊DOSDU板(見圖2)。
2012年8月27日,潮州BSC0的某一DOSDU出現(xiàn)故障(圖2右),由于數(shù)據(jù)選擇表中每個DOCMP模塊的輪詢頻率一致,和故障DOSDU同屬一個DOCMP模塊的另一個DOSDU板(圖2左)的SE利用率升高了一倍,立即出現(xiàn)SE擁塞并且DO的連接成功率明顯下降,導(dǎo)致用戶感知受到影響。
圖2
通過后臺調(diào)整數(shù)據(jù)選擇表,將故障DOSDU所屬的DOCMP模塊的輪詢頻率降低到一半后,擁塞解除,用戶感知得到恢復(fù)。
該案例是故障引起某一模塊的處理能力降低而引起各模塊之間的負(fù)荷失衡,進(jìn)而引起擁塞,通過調(diào)整業(yè)務(wù)分配策略保持各模塊的負(fù)荷均衡,解除擁塞、提高“連接成功率”,進(jìn)而提升用戶在業(yè)務(wù)接入維度上的感知。
【案例4】利用負(fù)荷分擔(dān)提供差異化服務(wù)的案例
目前,廣東電信存在大量基站為實現(xiàn)物理成環(huán),而成環(huán)改造需要較大的資金投入。在資金有限的前提下,我們優(yōu)先推動A級基站(覆蓋黨政軍、金融、醫(yī)療等重要業(yè)務(wù)的基站)的物理成環(huán)率改造,目前全省A級基站的物理成環(huán)率明顯高于低級別基站的物理成環(huán)率。這主要是考慮到不同用戶對“業(yè)務(wù)可用率”的要求不同而提供差異化服務(wù)。
該案例體現(xiàn)了利用負(fù)荷分擔(dān)提供差異化服務(wù)的思路。在相同的資源配置數(shù)量和系統(tǒng)故障率下,如果能適當(dāng)考慮不同客戶群對“業(yè)務(wù)可用率”的不同要求,對業(yè)務(wù)的承載進(jìn)行合理規(guī)劃,可以提高總體的用戶感知。
本文通過對負(fù)荷分擔(dān)的原理和移動通信中的用戶感知進(jìn)行研究,建立移動通信用戶感知模型,并結(jié)合CDMA中負(fù)荷分擔(dān)類業(yè)務(wù)的應(yīng)用,總結(jié)出負(fù)荷分擔(dān)類業(yè)務(wù)在系統(tǒng)設(shè)計和維護(hù)中應(yīng)該注意的問題。系統(tǒng)設(shè)計中需重點考慮的問題包括資源利用率和系統(tǒng)可靠性的綜合考慮、橫向和縱向的負(fù)荷平衡;系統(tǒng)維護(hù)中需重點考慮的問題包括資源調(diào)整和業(yè)務(wù)分配策略調(diào)整。
本文中提出的資源利用率和系統(tǒng)可靠性的平衡、動態(tài)調(diào)整業(yè)務(wù)分配策略的理念,以及負(fù)荷分擔(dān)中的連鎖效應(yīng)、差異化服務(wù),可以作為系統(tǒng)設(shè)計和維護(hù)的參考,有利于提高網(wǎng)絡(luò)的質(zhì)量和健壯性,進(jìn)而提高用戶感知。
見www.dcw.org.cn