交換機(jī)發(fā)生網(wǎng)絡(luò)通信故障問題時該怎么辦?
瀏覽次數(shù):發(fā)布時間:2020-03-16
交換機(jī)故障一般可以分為硬件故障和軟件故障兩大類,交換機(jī)雖然不常發(fā)生故障,但是一旦發(fā)生故障后都不太好檢測與排除。那么,當(dāng)交換機(jī)發(fā)生網(wǎng)絡(luò)通信故障了該怎么辦呢?今天就由
飛暢科技的小編來給大家說說交換機(jī)網(wǎng)絡(luò)通信故障怎么辦,感興趣的朋友就一起來詳細(xì)了解下吧。
交換機(jī)網(wǎng)絡(luò)通信故障怎么辦?
一、物理層線路連接
物理層線路連接是網(wǎng)絡(luò)正常使用的提前,不得不指出,很多時候所謂的網(wǎng)絡(luò)故障是因?yàn)槲锢韺泳€路接連所導(dǎo)致,比如:連接相應(yīng)桌面計(jì)算機(jī)的雙絞線連接了錯誤的交換機(jī)接口、RJ45連接頭松脫、沒有連接物理線纜等。在這里需要特別提出的是飛暢科技的交換機(jī)連接交換機(jī)使用交叉雙絞線、交換機(jī)與路由器或者計(jì)算機(jī)相連使用直通雙絞線。
如果您需要交換機(jī)在某個接口上進(jìn)行自適應(yīng)介質(zhì)接口,就必須在相關(guān)的接口模式下啟動auto-MDIX指令,auto-MDIX的全稱叫做automaticmedium-dependentinterfacecrossover自動介質(zhì)接口交叉,當(dāng)啟動這個功能后,無論接口連接的是哪種類型的線纜,交換機(jī)都能自動調(diào)節(jié)該接口使其保持正常的工作。啟動auto-MDIX有一個要求:該接口必須能自動協(xié)商速率與雙工模式。
二、雙工模式
雙式模式不匹配可能會產(chǎn)生相關(guān)的故障。以本書出版的時間為界線,現(xiàn)今網(wǎng)絡(luò)市場上幾乎所有的設(shè)備都支持全雙工模式,當(dāng)然除了傳統(tǒng)的集線器(HUB)設(shè)備外,應(yīng)該讓所有的網(wǎng)絡(luò)設(shè)備處于全雙式的模式下。默認(rèn)情況下,飛暢科技建議將交換機(jī)的接口配置成自動協(xié)商速度與雙工模式。
這樣做的理由是:如果發(fā)生一個半雙工的設(shè)備去連接
飛暢科技交換機(jī),那么,飛暢科技的交換機(jī)將把自己的全雙工降級成半雙工模式以適應(yīng)該設(shè)備的運(yùn)行,如果管理員強(qiáng)制要求交換機(jī)接口工作在全雙工模式下,將產(chǎn)生接口錯誤。排除的依據(jù)是使用showinterfacesfastEthernet0/1counterserrors查看接口上的錯誤。
三、接口出錯
交換機(jī)的接口出錯通常會導(dǎo)致大量的數(shù)據(jù)幀,比如:當(dāng)用戶發(fā)現(xiàn)基于TCP的應(yīng)用變得非常緩慢時,從表面看上去TCP的應(yīng)用變慢是乎與交換機(jī)接口故障無關(guān),但是進(jìn)一步思考,TCP變慢的更多原因是由于TCP慢啟動所致,在TCP慢啟動的狀態(tài)下TCP的滑動窗口尺寸將變小,而這種現(xiàn)象往往是交換機(jī)丟包所致,在這種狀況下,基于UDP的應(yīng)用就更可怕,因?yàn)閁DP根本不會重傳,所以網(wǎng)絡(luò)質(zhì)量將嚴(yán)重下降。
所以在排除這種故障時,我們需要知道,交換機(jī)為什么丟包,這往往與交換機(jī)的接口錯誤有關(guān),必須查看交換機(jī)接口的錯誤統(tǒng)計(jì)消息,關(guān)于交換機(jī)接口的錯誤統(tǒng)計(jì)消息,可以通過showinterfacex/ycounterserrors來得到,現(xiàn)在來理解每個錯誤統(tǒng)計(jì)器的意義:
nAlign-Err(對齊錯誤):如果數(shù)據(jù)幀不是以偶數(shù)個八位組結(jié)束就會出現(xiàn)對齊錯誤,指示是物理層差錯,一般是由于布線、交換機(jī)接口故障所引發(fā)。
nFCS-Err(幀校驗(yàn)錯誤):幀校驗(yàn)錯誤,通常也發(fā)生在物理層,并伴隨Align-Err現(xiàn)象。
nXmit-Err(發(fā)送錯誤):指示交換機(jī)的接口發(fā)送緩存溢出,這通常是入站和出站速率不匹配所造成的。
nRcv-Err(接收錯誤):指示交換機(jī)的接口接收緩存溢出,這通常是交換機(jī)的背板發(fā)生擁塞,導(dǎo)致接收緩存被堆滿。在很多時候接收錯誤也暗示了雙工模式不匹配。
nUnderSize(超短幀):指示校驗(yàn)和有效,但是幀尺寸小于64字節(jié),這表示連接到該接口的主機(jī)正在發(fā)送無效的數(shù)據(jù)幀尺寸。
nSingle-Col(單一沖突):指示在該接口成功發(fā)送數(shù)據(jù)幀之前,產(chǎn)生了一次沖突時會發(fā)生單一沖突錯誤,產(chǎn)生這種錯誤的原因是鏈路的使用率過高或者雙工不匹配。
nMulti-Col(多次沖突):指示在該接口成功發(fā)送數(shù)據(jù)幀之前,產(chǎn)生了多次沖突時會發(fā)生多次沖突錯誤,產(chǎn)生這種錯誤的原因是鏈路的使用率過高或者雙工不匹配。
nLate-Col(后期沖突):指示轉(zhuǎn)發(fā)數(shù)據(jù)幀以后,才檢測到的沖突,產(chǎn)生這種錯誤的原因是物理介質(zhì)(比如:線纜)過長、或者雙工不匹配。
nExcess-Col(過載沖突):當(dāng)數(shù)據(jù)幀連續(xù)遇到16次沖突后會被丟棄,此時就會出現(xiàn)過載沖突錯誤,產(chǎn)生這種錯誤的主要原因是鏈路的使用率過高、雙工不匹配、網(wǎng)絡(luò)中的設(shè)備特別是半雙工設(shè)備太多。
nCarri-Sen(載波偵聽):指示該接口工作在半雙工狀態(tài),根據(jù)CSMA/CD的工作原理,在半雙工狀態(tài)下發(fā)送數(shù)據(jù)時,需要進(jìn)行沖突檢測這將增加carri-sen計(jì)數(shù)器,在全雙工的模式下是不使用CSMA/CD。
nRunts(殘幀):幀的尺寸小于64個字節(jié),而且CRC錯誤,出現(xiàn)殘幀的錯誤一般是由物理層故障或者雙工模式不匹配所導(dǎo)致的。
nGiants(超長幀):幀的尺寸大于1518個字節(jié),通常出現(xiàn)超長幀錯誤是主機(jī)NIC故障所導(dǎo)致。
四、交換機(jī)CPU的使用率過高
通常交換機(jī)的架構(gòu)由兩個層面組成:一個控制層面、一個轉(zhuǎn)發(fā)層面??刂茖用尕?fù)責(zé)運(yùn)行交換機(jī)的操作系統(tǒng),STP、路由協(xié)議、維護(hù)路由表、執(zhí)行ACL等,控制層面包括交換機(jī)的CPU和內(nèi)存。
轉(zhuǎn)發(fā)層面包括交換機(jī)的轉(zhuǎn)發(fā)邏輯和背板,交換機(jī)的轉(zhuǎn)發(fā)邏輯是交換機(jī)用于做出轉(zhuǎn)發(fā)決定的硬件,該硬件負(fù)責(zé)重寫數(shù)據(jù)幀頭;
而交換機(jī)的背板負(fù)責(zé)物理連接到交換機(jī)的端口,它依賴于交換機(jī)的體系統(tǒng)架構(gòu),數(shù)據(jù)幀從交換機(jī)的入站接口進(jìn)入,然后轉(zhuǎn)發(fā)給交換機(jī)的背板,最后通過出站接口轉(zhuǎn)發(fā)數(shù)據(jù)幀。注意在這個過程中控制平面并不直接參與數(shù)據(jù)幀的轉(zhuǎn)發(fā)操作。所以在交換機(jī)正常工作的情況下,即便是流量轉(zhuǎn)發(fā)的高峰期,交換機(jī)的CPU占用率也應(yīng)該很低,因?yàn)樗恢苯訁⒓恿髁哭D(zhuǎn)發(fā)。
雖然控制層面不直接參與流量轉(zhuǎn)發(fā),但是由于轉(zhuǎn)發(fā)層面中的轉(zhuǎn)發(fā)邏輯卻來自于控制層面,因?yàn)閿?shù)據(jù)幀思轉(zhuǎn)發(fā)與控制層面還是存在一定的間接關(guān)系的,這樣的話,如果控制層面出現(xiàn)持續(xù)性的高負(fù)載,比如CPU占用率過高,這將影響交換機(jī)轉(zhuǎn)發(fā)數(shù)據(jù)的速率。所以從交換機(jī)的架構(gòu)來講,控制層面不會影響交換機(jī)的性能,但是在故障排除時還必須考慮控制層面的因素。
交換機(jī)的轉(zhuǎn)發(fā)邏輯以一個叫做TCAM的專用內(nèi)存體現(xiàn),TCAM與交換機(jī)的CEF功能相結(jié)合,數(shù)據(jù)轉(zhuǎn)發(fā)的速度將非??欤且坏┺D(zhuǎn)發(fā)邏輯故障,比如:TCAM內(nèi)存溢出,轉(zhuǎn)發(fā)邏輯將無法轉(zhuǎn)發(fā)流量,此時將由交換機(jī)的CPU來完成轉(zhuǎn)發(fā)流量,這將增加交換機(jī)CPU的開銷,轉(zhuǎn)發(fā)能力也會被降低?;蛘邠Q一句話來講,如果交換機(jī)的CPU占用率過高,這表示交換機(jī)已經(jīng)沒有使用轉(zhuǎn)發(fā)邏輯轉(zhuǎn)發(fā)數(shù)據(jù)幀,需要及時排查故障。