殷來(lái)明
(中石化石油工程地球物理有限公司裝備管理中心 江蘇 南京 211100)
近年來(lái)隨著地震勘探的深入推進(jìn),勘探裝備設(shè)備技術(shù)也日漸提高,而法國(guó)Sercel公司生產(chǎn)的428XL儀器,由于硬件老化、施工條件多變等因素,在施工過(guò)程中經(jīng)常出現(xiàn)死機(jī)、卡頓、重啟后不響應(yīng)等問(wèn)題,導(dǎo)致儀器操作過(guò)程極度緩慢甚至無(wú)法開(kāi)工。這樣單炮采集所需時(shí)間明顯增加,嚴(yán)重加大了地質(zhì)勘探成本,制約了震源施工工程的順利開(kāi)展。鑒于此,筆者結(jié)合自身的儀器操作實(shí)踐與思考,論述了428XL儀器硬盤(pán)故障的排查及解決過(guò)程,從而為可控震源生產(chǎn)操作中的相關(guān)技術(shù)難題的解決提供有益參考。
工區(qū)處在沙漠腹地,地形復(fù)雜,條件惡劣。沙丘落差大,道路崎嶇不平,斜坡處沙坑遍布,且經(jīng)常有強(qiáng)沙塵暴天氣,沙塵等細(xì)小顆粒物極易進(jìn)入儀器操作間內(nèi)。二維施工中儀器經(jīng)常搬家,途中顛簸嚴(yán)重,對(duì)儀器硬件設(shè)備的考驗(yàn)非常大。
故障初期階段,在施工過(guò)程中發(fā)現(xiàn)428XL儀器經(jīng)常突然死機(jī)、卡頓。正常放炮的每一步操作過(guò)程都變得非常緩慢,不夠流暢,且單炮采集所消耗的時(shí)間明顯變長(zhǎng),平均單炮時(shí)間是正常情況下的好幾倍。經(jīng)過(guò)對(duì)儀器的參數(shù)設(shè)置、硬件連接等檢查也未發(fā)現(xiàn)問(wèn)題,在服務(wù)器重啟過(guò)后又恢復(fù)正常。后期情況越發(fā)嚴(yán)重,儀器死機(jī)、卡頓頻率提高,且重啟過(guò)程也變得緩慢,比正常情況下重啟時(shí)間更長(zhǎng),最后甚至需要重啟好幾次才能啟動(dòng)成功。
綜合以上問(wèn)題情況,判斷該故障原因可能是:服務(wù)器主機(jī)內(nèi)存松動(dòng)[1];儀器電源等線路接觸不良[2];單線接收道數(shù)超過(guò)428XL單線帶道能力設(shè)計(jì),造成非實(shí)時(shí)傳輸;系統(tǒng)軟件崩潰;服務(wù)器硬盤(pán)故障。
在初步判定可能的問(wèn)題原因后,采用排除法進(jìn)一步檢查分析。
首先,檢查除服務(wù)器外的各配套硬件是否工作正常,尤其是可能會(huì)引起死機(jī)、數(shù)據(jù)傳輸?shù)牟考?,比如網(wǎng)絡(luò)交換機(jī),網(wǎng)線連接,VE464箱體與服務(wù)器之間的連接等。系統(tǒng)能夠啟動(dòng)時(shí),在服務(wù)器上打開(kāi)一個(gè)終端,輸入“ping”命令,檢查網(wǎng)絡(luò)連接情況。經(jīng)過(guò)檢查發(fā)現(xiàn),系統(tǒng)間各硬件之間網(wǎng)絡(luò)連接情況良好。且通過(guò)對(duì)硬件的檢查,發(fā)現(xiàn)各部件外觀良好,沒(méi)有破損、斷線、短路情況。
其次,在帶道能力方面,現(xiàn)場(chǎng)實(shí)際單線采集為420道@1 ms@ 8 Mbp,不影響實(shí)時(shí)傳輸。如果單線超過(guò)428XL硬件設(shè)計(jì)的最大實(shí)時(shí)采集能力[3](大線數(shù)傳輸率:1 000 道@ 2 ms@ 8 Mbp)的話,428XL表現(xiàn)是不能實(shí)時(shí)傳輸,在數(shù)據(jù)采集過(guò)程中傳輸較慢,與目前的情況存在明顯區(qū)別。
排除以上兩點(diǎn)情況之后,進(jìn)一步檢查428XL服務(wù)器內(nèi)部硬件情況。將儀器關(guān)機(jī)、斷電,將服務(wù)器從固定架上取下檢查,檢查外觀無(wú)誤后,逐一對(duì)各種連線接口及內(nèi)存條檢查,并用橡皮擦拭干凈,重新裝好。啟動(dòng)時(shí)開(kāi)機(jī)畫(huà)面正常,開(kāi)機(jī)硬件檢測(cè)正常,內(nèi)存工作正常。在畫(huà)面跳轉(zhuǎn)到Liunx紅帽子系統(tǒng)啟動(dòng)時(shí),服務(wù)器又卡住。再次重啟,在出現(xiàn)“Press any key for Option ROM Massages”畫(huà)面時(shí),摁任意一鍵,進(jìn)入硬件信息界面,在硬盤(pán)狀態(tài)信息中發(fā)現(xiàn),正常應(yīng)該顯示3塊硬盤(pán)(如圖1)的狀態(tài)信息,此時(shí)只有2塊硬盤(pán)(如圖2)的狀態(tài)信息顯示(即只顯示設(shè)備ID:0、1,沒(méi)有2)。再次斷電,對(duì)服務(wù)器硬盤(pán)檢查、重接、重啟。啟動(dòng)過(guò)程中留意服務(wù)器運(yùn)行情況,發(fā)現(xiàn)某硬盤(pán)發(fā)出異常響聲,硬件狀態(tài)信息正常,啟動(dòng)過(guò)程又停在紅帽子系統(tǒng)啟動(dòng)界面,如此反復(fù)多次。
圖1 硬盤(pán)正常狀態(tài)信息
圖2 硬盤(pán)異常狀態(tài)信息
在多年施工經(jīng)驗(yàn)中,428XL問(wèn)題大多由軟件引起,硬件方面一般以固件松動(dòng)較多。出現(xiàn)如此情況,推斷問(wèn)題原因有兩點(diǎn):一是系統(tǒng)崩潰,需要重裝;二是某塊硬盤(pán)故障。進(jìn)行進(jìn)一步排查,先重裝系統(tǒng)。重裝系統(tǒng)過(guò)程中發(fā)現(xiàn),每一步操作變得異常緩慢,需要的時(shí)間非常長(zhǎng),每?jī)刹讲僮髦g的時(shí)間達(dá)到了十幾二十分鐘之久。加上服務(wù)器啟動(dòng)時(shí)的硬盤(pán)異響情況,推斷服務(wù)器某塊硬盤(pán)有故障。
經(jīng)過(guò)初步檢查發(fā)現(xiàn)是硬盤(pán)問(wèn)題后,進(jìn)一步確定是具體哪塊硬盤(pán)故障。因?yàn)樾£?duì)設(shè)備有限,缺乏相應(yīng)的專業(yè)人員和硬盤(pán)檢測(cè)設(shè)備??紤]到上述情況,決定將硬盤(pán)逐塊拔下,分別重裝系統(tǒng),以裝機(jī)時(shí)速度反應(yīng)情況判斷哪塊硬盤(pán)有問(wèn)題。經(jīng)進(jìn)一步檢測(cè),最終將有問(wèn)題的那塊硬盤(pán)找出。
428XL服務(wù)器主機(jī)有3塊硬盤(pán),分別對(duì)應(yīng)不同的用途[4],而且硬盤(pán)接口有別于普通硬盤(pán),此時(shí)1塊硬盤(pán)損壞、無(wú)法使用。根據(jù)現(xiàn)場(chǎng)實(shí)際情況,提出以下3個(gè)解決方案。
1)重新調(diào)撥一臺(tái)新的428XL服務(wù)器主機(jī),但耗時(shí)較長(zhǎng)。
2)購(gòu)買(mǎi)新的硬盤(pán)。但有2點(diǎn)難處:一是采購(gòu)適配硬盤(pán)困難;二是耗時(shí)較長(zhǎng)。
3)在缺少硬盤(pán)的情況下,對(duì)428XL服務(wù)器進(jìn)行重裝系統(tǒng)。
排除前2個(gè)方案后,計(jì)劃采用第3個(gè)方案。此方案也存在一定的風(fēng)險(xiǎn),屬于非正常裝機(jī),428XL安裝手冊(cè)也沒(méi)有相應(yīng)的操作過(guò)程。先固定好428XL服務(wù)器硬件,準(zhǔn)備系統(tǒng)重裝。這里以SERCEL REDHAT Enterprise V5.8 (64 bit)為例(具體安裝版本以現(xiàn)場(chǎng)實(shí)際為準(zhǔn)),操作步驟如下:
前期步驟參照《428XL安裝手冊(cè)》進(jìn)行[5]。
在第11步“In the partitioning window”中,對(duì)于“- Make sure the sda, sdb and sdc partitions are selected”一項(xiàng),此時(shí)應(yīng)該是確保sda,sdb兩項(xiàng)被選中,因?yàn)闆](méi)有第3塊硬盤(pán),其他參照手冊(cè)。
第19步“Select /dev/sdc1. Click Edit. In the Edit Partitions: /dev/sdc1”窗口中,此時(shí)安裝過(guò)程中應(yīng)該沒(méi)有此項(xiàng)設(shè)置,那么應(yīng)該操作如下:
Click New. In the Add Partition window:
- Unselect sda.Only sdb should be selected.
- From the File System Type pull-down menu, select “ext3”.
- Type /var/dump0 in the Mount Point field.
- Choose the Fill To Maximum Allowable Size option.
- Make sure “Encrypt” is unticked.
- Click OK.
其他步驟參照《428XL安裝手冊(cè)》繼續(xù)進(jìn)行。
428XL系統(tǒng)重裝完成后聯(lián)機(jī)放炮測(cè)試,儀器工作正常,順利解決難題。
428XL儀器作為地震勘探的核心設(shè)備,要及時(shí)做好儀器的檢修、維護(hù)工作,生產(chǎn)中更是需要做好保護(hù)工作,在操作中嚴(yán)格按照規(guī)范進(jìn)行。大致來(lái)說(shuō),儀器的操作注意事項(xiàng)主要包括儀器車(chē)的停放、儀器的使用及維護(hù)。
1)儀器車(chē)的停放 儀器車(chē)停放要求平穩(wěn),盡量遠(yuǎn)離建筑物、高壓線等具有干擾性的物體,保持儀器周?chē)諘玳_(kāi)闊,儀器車(chē)停好后使用三角木防止溜車(chē),接地線插好并澆水保證接地良好。
2)儀器的使用及維護(hù) 儀器的使用及維護(hù)須嚴(yán)格按照操作規(guī)范進(jìn)行。428XL儀器是精密電子設(shè)備,使用還需做好防塵、防靜電措施。儀器故障檢查時(shí)為防止次生災(zāi)害發(fā)生,需對(duì)人體進(jìn)行防靜電措施。拆卸、檢查儀器內(nèi)部電子設(shè)備時(shí)手不能直接觸摸電路,要持電路板的側(cè)部。此次檢查打開(kāi)服務(wù)器箱體后發(fā)現(xiàn)內(nèi)部布滿灰塵,對(duì)內(nèi)部器件散熱及運(yùn)行有一定的影響。尤其是進(jìn)入硬盤(pán)內(nèi)部的灰塵,在長(zhǎng)時(shí)間運(yùn)行后會(huì)對(duì)硬件造成不可恢復(fù)的損害。因此,要經(jīng)常打掃儀器操作間,保證操作間干凈整潔,禁止吸煙。
本文通過(guò)對(duì)故障現(xiàn)象的分析,從儀器的帶道能力設(shè)計(jì)、硬件連接等方面逐一排查,確定為硬盤(pán)故障,并在缺少1塊硬盤(pán)的情況下重裝系統(tǒng),解決問(wèn)題,并給出此類儀器的使用注意事項(xiàng),減少使用過(guò)程中的故障率。文中解決方案為臨時(shí)方案,對(duì)服務(wù)器性能會(huì)有一定的影響,對(duì)于高精度三維等大型地震勘探可能會(huì)限于硬盤(pán)容量問(wèn)題難以實(shí)施,最終仍得及時(shí)更換壞硬盤(pán)。