測試儀器解決無線網(wǎng)絡問題
1引言
蜂窩移動通信的網(wǎng)絡結(jié)構(gòu)大體可分為終端、基站、基站控制器和MSC幾大網(wǎng)元。它們之間的接口稱之為Um,Abits,A接口。任何一個網(wǎng)元或接口出現(xiàn)問題,都會導致無線網(wǎng)絡故障。各式各樣的天饋系統(tǒng)、直放站、塔放、五花八門的無線衰落環(huán)境、數(shù)量驚人的Abit2MB接口和CIC電路,以及眼花繚亂的手機終端等,使得查找無線網(wǎng)絡故障變得錯綜復雜。在這里,“準確定位、迅速打擊”說的不是“外科手術(shù)式”軍事打擊,而是移動通信“特種兵”(運維和網(wǎng)絡優(yōu)化通信工程師)的夢想。本文將通過幾個實際案例來說明如何巧妙利用手頭的儀器來查找復雜的無線網(wǎng)絡問題。
2裝備
“工欲善其事,必先利其器”。對于運維和網(wǎng)絡優(yōu)化通信工程師來說,為了解決復雜的問題,必要的測試設備是必需的。下面的這些儀器是經(jīng)??赡苡玫降摹把b備”。
?。?)手機綜合測試儀RSCMU200。用于測試手機射頻和協(xié)議性能。能模擬基站,BSC,交換網(wǎng)元,可設置無線網(wǎng)絡參數(shù),支持GSM/(E)GPRS,CDMA/EV-DO,WCDMA/HSPA信令測試。
(2)音頻分析儀RSUPV。用于測試手機的音頻性能。含GSM,WCDMA,CDMA手機音頻測試軟件,可以同時產(chǎn)生2路0~200kHz的單音或多音信號、同時分析2路0~250kHz的音頻信號,直接顯示音頻頻率,電平,THD,SINAD等指標。
?。?)手持式多功能頻譜儀RSFSH。用于頻譜、天饋線測試和干擾查找。支持的測試項目有VSWR測試,斷點測試,GSM,WCDMA,CDMA信道功率測試,頻譜分析,增益測試,干擾測試等。
?。?)路測軟件RSROMES+掃頻儀RSTSMx。用于網(wǎng)絡覆蓋測試和干擾查找??煽刂贫嗯_測試手機和掃頻儀測試。支持 GSM/(E)GPRS,CDMA/EV-DO,WCDMA/HSPA網(wǎng)絡,能直接輸出GSM同、鄰頻干擾小區(qū),GSM,CDMA,WCDMA遺漏鄰小區(qū),導頻污染數(shù),實時Layer3消息。
3實際案例
3.1案例1
?。?)問題:多臺GSM手機某日早上在本地開機后顯示“未注冊SIMCard”,而這些手機里的SIM開之前都能正常工作。把SIM卡換到別的手機后故障依舊,但讀卡器讀取SIMCard用戶信息正常。
?。?)分析:HLR遺漏IMSI信息,網(wǎng)絡阻斷,SIM卡問題,都會導致注冊失敗。查找該問題需要協(xié)調(diào)各個部門,且工作量很大。但我們巧妙地利用路測軟件ROMES和手機綜測儀CMU200,通過跟蹤手機的Layer3消息當場就很快地找到了故障。
?。?)方法:把待測SIM卡放入受控于ROMES軟件的GSM測試手機中,在當前網(wǎng)絡環(huán)境下開機、嘗試注冊,實時記錄測試手機注冊失敗的 Layer3消息(見圖1)。連接屏蔽箱和CMU200的射頻端口,測試手機放入屏蔽箱(見圖2)。設置CMU200工作在GSM900頻段,不鑒權(quán),參數(shù)為通用設置。開機,關上屏蔽箱,此時屏蔽箱中僅存在CMU200發(fā)射的信號,手機仍然無法注冊,狀態(tài)不變,因此可以排除Abits口以上設備或參數(shù)原因。使用標準測試卡更換原SIM卡后,重復相同操作,開機后成功注冊,ROMES實時記錄了測試手機的Layer3注冊消息(見圖3)。通常手機開機注冊的過程應該是這樣的(見圖4):
圖1失敗的位置更新消息
圖2CMU200與屏蔽箱連接測試手機
圖3成功的位置更新消息
圖4GSM手機開機注冊流程
圖5音頻分析儀與CMU200配合測試手機音頻性能
圖6用ROMES加上TSMx來查找干擾
手機開機后首先搜尋上次關機SIM卡儲存的頻率,如果無法找到,會在整個支持的GSM頻段尋找電平最強的信號,鎖定頻率后,完成同步、接收系統(tǒng)消息。
隨后手機啟動IMSI配置程序,通知系統(tǒng)其進入激活狀態(tài)。
手機啟動IMSI程序有兩種方法:IMSI鑒別或TMSI和LAI鑒別。
當手機首次啟用新SIM卡開機、手機轉(zhuǎn)移到了另外一個PLMN區(qū)、手機移動到了另外一個剛復位的VLR和VLR刪除了此手機數(shù)據(jù)的時候才會使用IMSI鑒別方式,即在注冊過程中需要手機把IMSI傳送給MSC。
其它情況時,應該使用TMSI和LAI鑒別方法。即通過手機把上次通訊時記錄的TMSI和LAI發(fā)送到目的地VLR(即開機所在地VLR),目的地VLR 按照原LAI查詢到初始地VLR,通過初始地VLR按照原TMSI查詢到IMSI及鑒別組信息,目的地VLR使用此鑒別組向手機發(fā)送隨機號碼鑒別,如果手機響應鑒別成功,目的地VLR按照得到的IMSI,向HLR申請得到用戶完整數(shù)據(jù),接著目的地VLR向手機發(fā)送認證確認消息,從而完成了注冊過程。
手機SIM卡把新的LAI記錄,之后即可提供通信服務。
對比正常和故障情況(見圖1,圖2,圖3),可以發(fā)現(xiàn):
正常情況下注冊是符合規(guī)范的。任何手機為了向系統(tǒng)通知其準備激活,開機后的位置更新方式應該采用“IMSI附著”的類型,手機鑒別的方式可按情況選用“TMSI和LAI”或“直接發(fā)送IMSI”的方式。為了保密,通常不采用“直接發(fā)送IMSI”的方式。
故障手機不但在開機后位置更新方式采用了“一般位置更新”類型,在手機鑒別方式上還選擇了“直接發(fā)送IMSI”的方式。通常“一般位置更新”類型用于空閑手機從一個LAC區(qū)移動到另一個LAC區(qū)時的位置更新,僅作LAI的更新,不需要IMSI的認證。因此,當手機開機后如果采用了此種方式,手機就不會發(fā)送 IMSI或TMSI,目的地VLR就沒有途徑得到手機的IMSI及鑒別組信息,既無法從HLR得到手機用戶完整數(shù)據(jù),也沒法向手機發(fā)出鑒別消息,因此目的地VLR只能通過MSC發(fā)出拒絕手機的位置更新申請的消息,拒絕的理由只是簡單地歸類為HLR查詢不到IMSI,導致手機出現(xiàn)“未注冊SIMCard”的現(xiàn)象。
什么導致了位置更新類型的變化?最值得懷疑的對象就是儲存著鑒別信息、存儲著決定位置更新類型的程序SIM卡。在更換了SIM卡后,注冊、通訊恢復正常。是何原因?qū)е铝嗽瓉鞸IM卡的設置改變?SIM卡實際就是一張存儲卡,存儲著手機正常通訊需要的程序及信息,其內(nèi)容在特定的條件下可讀、可寫。當某個誘因出現(xiàn)時,就有可能誘發(fā)程序出錯。是否由于系統(tǒng)升級或開通了新的PLMN導致故障發(fā)生,需要進一步調(diào)查,但是最重要的是通過使用RS的無線儀表,在沒有查網(wǎng)絡端的前提下就準確地完成了定位,迅速地解決了問題。
3.2案例2
?。?)問題:某批用于EV-DORevA無線網(wǎng)絡的UIM卡插入AT后開機不能上網(wǎng)。
?。?)分析:HLR遺漏IMSI信息導致AT無法注冊,AT鑒權(quán)失敗,AN與AT參數(shù)協(xié)商失敗,UIM卡等問題,都會導致AT與AN不能建立會話連接——即不能上網(wǎng)。為了快速查找問題,我們使用了無線綜測儀CMU200。
(3)方法:一般EV-DO的AT上網(wǎng)的流程為:AT在PRL上查詢是否支持EV-DO及EV-DO的優(yōu)先頻點。如果支持EV-DO,AT調(diào)整頻率到EV-DO的優(yōu)先頻點(一般為37),開始與AN作會話參數(shù)協(xié)商。如果會話協(xié)商成功,AN會分配一個惟一接入代號UATI給AT,AN也同時獲得了 AT提供的SessionSeed和ESN,為會話連接做準備。AT發(fā)出會話連接申請,EV-DO的AAA鑒權(quán)服務器要求AT按照CHAP協(xié)議輸入用戶名和密碼,完成接入EV-DO網(wǎng)絡的鑒權(quán)。接著PDSN也會要求客戶按照CHAP協(xié)議輸入互聯(lián)網(wǎng)接入用戶名和密碼,完成上網(wǎng)鑒權(quán)。隨后建立PPP連接,實現(xiàn)上網(wǎng)功能。分析問題需要重現(xiàn)故障現(xiàn)象。由于待測試AT不能與ROMES相連,所以無法從AT端監(jiān)測。因此需要搭建一個測試環(huán)境,從AN側(cè)來確定問題所在。我們采用了案例1中的CMU200+屏蔽箱的方案。
在CMU200上設置AN的頻率為37,設置Subtype為2,支持EV-DORevA版本,下行功率-70dBm,AT開機后發(fā)現(xiàn)AT與CMU200(AN)不能完成會話協(xié)商。
CMU200側(cè)偵測到5個為一組的功率從低到高不斷循環(huán)的信號,與CMU200ProbesperSequence的定義值5相符合,因此認為這就是AT 發(fā)出的接入試探。由此判斷AT已正常發(fā)出無線信號,但是由于物理層承載的協(xié)議參數(shù)無法在AT與AN之間通過協(xié)商達成一致,導致了無法進入Session Open狀態(tài),從而無法建立會話連接。
進一步了解得知此批UIM只能用于指定區(qū)域的固定上網(wǎng)點,通過設置10位(16進制)的SectorID實現(xiàn)鎖定指定區(qū)域的目的。
按照ANSI41規(guī)范,SectorID為6位字長(16進制)。修改CMU200中的SectorID format為人工指定格式,并按照UIM廠商提供的信息輸入10位Sector ID后,AT與CMU200順利完成會話協(xié)商,成功連接。
到指定區(qū)域驗證,事實果然如此。
3.3案例3
?。?)問題:經(jīng)常收到某區(qū)域的GSM客戶投訴:存在單通情況。
?。?)分析:由于單通現(xiàn)象出現(xiàn)的概率一般不高,如果需要重現(xiàn)故障、查找導致單通的原因需要耗費大量的人力、時間。無線鏈路上、下行不平衡,基站載波故障,基站基帶板件故障,BSC聲碼器故障,天饋線故障,無線干擾,基站Abits口存在環(huán)回,交換機的回音抑制器故障,BSC與MSC的A接口 CIC不對應等都會引起單通現(xiàn)象。因此,一般從最簡單、最大可能性的測試做起,使用簡潔的方法,爭取用最少的時間、最少的人力解決問題。
?。?)方法
分析問題發(fā)現(xiàn),出現(xiàn)投訴的區(qū)域分屬不同的基站覆蓋區(qū)域,但是卻同屬一個BSC,因此某個基站的無線、硬件故障的可能性不大。因此,排查的主要對象落在了手機、區(qū)域干擾和BSC,MSC上。
最容易實施的是檢測投訴客戶手機。在此案例中,更換手機后測試多次仍然存在此故障,可確定不是手機原因。如果懷疑是手機引起的單通,則可以使用 RS的音頻分析儀UPV測試手機音頻收發(fā)電路。如圖5所示,在CMU200與手機建立連接后,運行UPV的手機音頻測試軟件,可以自動得到手機的音頻發(fā)送響度(SLR)、接收響度(RLR)及頻率響應曲線等量化指標,從而驗證手機的音頻電路。
既然此案例已經(jīng)確定問題在無線網(wǎng)絡,接著可以先查找是否存在區(qū)域干擾。使用ROMES軟件控制掃頻儀TSMx在問題區(qū)域查找是否存在同、鄰頻干擾(見圖6),查找結(jié)果為無干擾。
然后就需要作最耗費時間和精力的CIC測試。通常需要一個工程師從交換側(cè)把A接口鎖剩兩個CIC(保留1路控制信令鏈路),另外兩個射頻工程師負責撥號、接通、人工說話、人工接聽、人耳監(jiān)聽是否存在單通。如果存在單通,此時即可定位此兩個CIC存在問題,接著測試下兩個CIC,如此往復,鎖定有問題的 CIC后即可排除故障。但是,CIC的數(shù)量非常龐大,并且為了不影響用戶使用,只能深夜進行,需要耗費非常多的時間和精力。
如果能巧妙利用ROMES路測軟件,就可以節(jié)省人力和時間。方法是:使用ROMES軟件控制兩臺測試手機,一臺測試手機A的麥克風線路連接到了 PC的聲卡音頻輸出端,另一臺測試手機B耳機線路連接到了自帶小型功放的臺式音箱的音頻輸入端,PC循環(huán)播放一段音樂通過音頻線路送到A的音頻接收端,手機A受 ROMES控制,自動循環(huán)撥通B手機,呼叫經(jīng)過基站,然后到BSC,接著連接到交換機,交換機會分配鎖剩的兩個CIC與BSC連接,建立通話。音樂因此也送到了自動接聽的測試手機B的耳機線路上,同時也送到了音箱的音頻輸入端,這時音箱即會播放PC播放的音樂。工程師只需要聆聽音箱是否正常發(fā)聲,即可判斷此兩個CIC是否存在問題。如果正常,關閉這兩個CIC,打開下兩個CIC,繼續(xù)檢查。由此往復,整個過程只需要一個工程師連續(xù)操作。交換工程師如果使用了一個自動鎖定、自動解鎖的程序,測試CIC效率更會得到極大的提高。
采用這一改進方法,只使用了約1h即找到了存在硬件故障的CIC電路,鎖定此CIC后順利解決了單通問題。
按照上述案例方法,還可舉一反三地變換出各種符合實際情況的測試方案。如果能巧妙利用測試儀表靈活、方便、多功能的特性,就可以幫助我們快速、準確、有效地定位移動通信無線網(wǎng)絡故障、巧妙解決復雜網(wǎng)絡問題。
評論