齊洪偉
(中國電信股份有限公司滄州分公司,河北滄州 061000)
在OLT運行過程中,機房環(huán)境情況、設(shè)備安裝情況、風扇運轉(zhuǎn)情況再加上天氣炎熱、機房溫度升高等因素,都可能會引起設(shè)備單板高溫。單板在高溫環(huán)境下運行,會引發(fā)單板業(yè)務(wù)異常,影響用戶感知和設(shè)備運行的穩(wěn)定性,嚴重的會導致板卡因高溫異常重啟,單板損壞,顯著降低設(shè)備壽命,甚至導致單板報廢無法修復(fù)。
詳細介紹案例的分析過程、問題分類定界方法,最終定位問題原因等。主要針對改進風扇轉(zhuǎn)速溫控合理性的同時,定期對網(wǎng)元溫度及現(xiàn)場情況進行巡檢和處理,確保設(shè)備風扇通風良好,熱量及時有效地散發(fā)出來,降低設(shè)備溫度,確保設(shè)備運行狀態(tài)良好。
為避免出現(xiàn)誤判以及遺漏,建議所有網(wǎng)元都進行檢查、清潔降溫操作。OLT單板正常運行溫度應(yīng)低于50度,機房環(huán)境溫度低于30度??蓛?yōu)先處理梳理出來的單板溫度高網(wǎng)元。
每季度進行一次清潔降溫處理,在夏季到來之前一定要進行清潔降溫處理。
由于OLT作為接入網(wǎng)站點,數(shù)量多,分布廣。對于前往站點的時間計劃和線路安排尤為重要。一般情況下,開門順利的話,一個網(wǎng)元進機房加操作需要20~25min,另外需要加上前往網(wǎng)元的時間。根據(jù)網(wǎng)元的分布情況,按區(qū)域或分局制定線路圖比較合適,根據(jù)站點分布情況確定。
螺絲刀、鑷子、軟毛刷、吹塵球、吸塵器、清潔劑、抹布、防靜電手腕、絕緣手套、扎帶、斜口鉗、筆記本電腦、串口線、網(wǎng)線等。工具準備見圖1。
不僅限于一定數(shù)量的風扇備件、假面板、光纖、法蘭等。
此步驟需要提前操作,避開找到單板溫度高網(wǎng)元,用以重點處理。
圖1 工具準備Fig.1 Tool preparation
注:為了個人及操作安全,在接觸設(shè)備整個操作過程中,務(wù)必戴好絕緣手套、并帶上防靜電手環(huán)。操作完成后,務(wù)必聯(lián)系機房或網(wǎng)管、廠家工程師,確認降溫效果是否達到要求,然后再離開現(xiàn)場。OLT單板正常運行溫度應(yīng)低于50度,機房環(huán)境溫度低于30度。
(1)環(huán)境檢查。
檢查機房空調(diào)運轉(zhuǎn)情況,如空調(diào)出現(xiàn)損壞或制冷效果不好,盡快聯(lián)系相關(guān)責任人處理空調(diào)問題。室外站點需檢查室外機柜周圍的通風情況、機柜空調(diào)或熱交換器的運行情況等。并記錄空調(diào)當前溫度,并對機房環(huán)境和溫度等使用手機拍照留存。
(2)登錄網(wǎng)元查看相關(guān)信息(這部分操作可由機房或網(wǎng)管、廠家工程師配合完成)
Telnet或串口登錄網(wǎng)元,使用命令查看網(wǎng)元風扇狀態(tài)、網(wǎng)元線卡溫度、告警、板卡狀態(tài)等信息。命令如下:
Show fan
Show card-temperature
Show alarm pool
Show card
(3)機柜狀況檢查及處理。
1)檢查機柜門是否完全閉合或無機柜門。
處理方法:
如因為一些障礙物擋住,先處理障礙物以便清潔處理后關(guān)閉機柜門。如沒有安裝機柜門,則進行安裝。如果現(xiàn)場未找到機柜門,則需要記錄下來,在整改報告中給出建議,請局方處理。
圖2 機框上的空槽位Fig.2 Empty slots on the chassis
2)機框上的空槽位是否有缺少假面板,請拍照留存。如圖2所示。
處理方法:
按照機框假面板,并拍照留存。
3)風扇是否存在告警(檢查告警燈),請拍照留存。如圖3所示。
處理方法:
Telnet或串口連接網(wǎng)元,使用下列命令進行操作:
Show fan
(config)#fan reset
過一分鐘后再次show fan看看是否能夠恢復(fù)。如果還是無法恢復(fù)進行風扇拔插(注意戴好絕緣手套和靜電手環(huán))。如果此時告警還是無法恢復(fù),使用自帶的風扇進行更換。如此時還是無法恢復(fù),則系統(tǒng)存在異常,需要聯(lián)系廠家工程師定位處理。
(4)風道通風情況檢查。
1)機框上側(cè)出風口間隔是否過小,請拍照留存。
處理方法:
拍好照片留存,在后續(xù)報告中標出,聯(lián)系相關(guān)責任人整改,至少需要空出3U的高度。
2)PON口光纖布放凌亂,請拍照留存。
處理方法:
對光纖進行梳理,如果需要拔出PON口才能梳理的,由于會斷業(yè)務(wù),先拍照留存,后續(xù)請相關(guān)人員處理。
3)機框下側(cè)入風口間隔是否過小,請拍照留存。
處理方法:
拍好照片留存,在后續(xù)報告中標出,聯(lián)系相關(guān)責任人整改,至少需要空出3U的高度。
(5)灰塵清潔。
1)C300風扇清潔。
戴好絕緣手套和靜電手環(huán),將現(xiàn)場風扇拔出,插上自帶的備用風扇。由于風扇之前屬于快速轉(zhuǎn)動狀態(tài),拔出風扇時,需要停30s再從機框中拿出來。然后進行清掃和吸塵。
圖3 風扇是否存在告警Fig.3 Whether the fan has an alarm
圖4 C300機框底部進風口未清理前Fig.4 Before cleaning the air inlet at the bottom of the C300 chassis
圖5 清理后的效果Fig.5 The effect after cleaning
風扇清潔后,再將備用風扇更換成原有風扇。
2)C300入風口和出風口的灰塵清潔。
針對機框底部入風口和機框頂部出風口的積灰進行清潔,使用軟毛刷進行清掃,并使用吸塵器及時將灰塵吸出。如灰塵黏連的比較嚴重,需要使用抹布擦拭并使用吸塵器吸出。
圖4為C300機框底部進風口未清理前堵塞情況,嚴重影響進風。
清理后的效果如圖5所示。
C320入風口和風扇清潔。
C320從機框右側(cè)進風,左側(cè)出風,風扇框在機框左側(cè)。注意清理機框右側(cè)入風口和左側(cè)出風口,并清理風扇,清潔后的效果檢查。
再次telnet或串口登錄網(wǎng)元使用下面命令檢查,觀察網(wǎng)元降溫效果:
Show fan
Show card-temperature
Show alarm pool
Show card
對于暫時解決不了的網(wǎng)元,網(wǎng)元風扇控制模式可以調(diào)整為固定轉(zhuǎn)速,強制使用4的最大轉(zhuǎn)速。
具體對風道清潔處理后的降溫效果驗收規(guī)范如下:
所有板卡溫度沒有高于50度的線卡(10G PON板低于60度),環(huán)境溫度低于30度。
現(xiàn)場假面板安裝、機柜門關(guān)閉、風道口不堵塞、上下通風口至少留有3U空間、風扇告警燈滅等。
查看記錄整改后的溫度值備案:
Show fan
Show card-temperature
Show card
通過以上方法,可以有效降低設(shè)備(中興OLT設(shè)備)溫度,確保設(shè)備運行在合理的溫度,保證設(shè)備狀態(tài)良好,不影響用戶感知。