新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問(wèn)題描述
客戶對(duì)網(wǎng)絡(luò)10個(gè)OSN3500組成的STM-64MSP環(huán)進(jìn)行清理光纖操作時(shí),發(fā)生MSP倒換,此時(shí)一站點(diǎn)部分支路板上報(bào)V5_VCAIS和TU-AIS告警??蛻魴z測(cè)用戶側(cè)業(yè)務(wù)無(wú)任何影響,告警在3分鐘內(nèi)逐漸消失。次日晚,隨客戶一起做MSP倒換測(cè)試,告警依舊,業(yè)務(wù)正常。
處理過(guò)程
根據(jù)結(jié)論將設(shè)備的主控和單板升級(jí)至V1R7版本配套。倒換測(cè)試后無(wú)任何異常告警。
根因
檢查此OSN3500設(shè)備主機(jī)版本為:5.21.13.47p01. 此設(shè)備帶擴(kuò)展子架,共計(jì)各類單板72 。
1.查看資料V5_VCAIS告警表示低階通道VC-12中V5字節(jié)的第5比特到第7比特全為“1”。此告警將影響業(yè)務(wù)。
2.采集單板黑甲子bb4.log和bb9.log 經(jīng)研發(fā)分析。
3.當(dāng)單板通過(guò)單板方式同時(shí)上報(bào)給主機(jī)的告警條數(shù)過(guò)大時(shí)(超過(guò)1024),就會(huì)有告警隊(duì)列溢出的現(xiàn)象,在主機(jī)Telnet上有告警隊(duì)列ID溢出的打印,導(dǎo)致部分告警的end消息丟棄掉(由于當(dāng)時(shí)復(fù)用段倒換的時(shí)候,單板會(huì)有瞬間的業(yè)務(wù)中斷,并上報(bào)大量告警,但實(shí)際的業(yè)務(wù)只是瞬斷,沒(méi)有影響到業(yè)務(wù)和倒換測(cè)試。另外就是此網(wǎng)元單板非常的多,告警隊(duì)列溢出的可能性非常大)。4.此告警必須靠主機(jī)的1分鐘校驗(yàn)事件校驗(yàn),通過(guò)3分鐘后將告警結(jié)束掉(所以看到上報(bào)的告警都在3分鐘內(nèi)結(jié)束,就是有主機(jī)在3分鐘的校驗(yàn)檢測(cè)后,把其濾掉的)。
5.定位分析,提出單板用多包方式上報(bào)告警給主機(jī),單板將打包成64告警為一包上報(bào)給主機(jī),而主機(jī)的消息隊(duì)列是1024的長(zhǎng)度,可以將主機(jī)的處理能力大大提高,通過(guò)測(cè)試該現(xiàn)象消失,能正常產(chǎn)生也能正常結(jié)束。
6.結(jié)論:因R1~R6未修改單板軟件用多包方式上報(bào)告警的版本,而V1R7軟件版本已經(jīng)解決單板多包方式上報(bào)。所以需要將單板升級(jí)到V1R7版本且主機(jī)配套。