您的位置:首頁>正文

定位伺服器資料丟棄包問題

當某個伺服器發生資料丟包時, 它們肯定是由於某種原因。 我們如何來分析為什麼資料包丟失。

以下是我們想要瞭解的情況:

一個資料包進入您電腦的網路堆疊( RX )(例如在埠 8000 上)。 在埠 8000 對應的應用程式接收之前被丟。

發送一個資料包( TX )。 在它從您的機器發出之前被丟。

本文不關注“資料包在網路傳輸過程丟了, 讓我們用 traceroute / 通過計數 TCP 重傳進行診斷”(雖然這也很重要)!

怎麼知道資料包是否被丟棄?

我在 Twitter 上提問, 得到了非常有用的答案 “看 netstat -i !”這是我的筆記型電腦上運行得到的結果:

bork@kiwi~> sudo netstat -i Kernel Interface table Iface MTU Met RX-OK RX-ERR RX-DRP RX-OVR TX-OK TX-ERR TX-DRP TX-OVR Flg docker0 1500 0 0 0 0 0 0 0 0 0 BMU enp0s25 1500 0 1235101 0 242 0 745760 0 0 0 BMRU lo 65536 0 21558 0 0 0 21558 0 0 0 LRU nlmon0 3776 0 551262 0 0 0 0 0 0 0 ORU

看起來有一些收到的( RX )資料包在 enp0s25 (我的無線網卡)上丟失了。

但是沒有 TX 包丟失。

有人也告訴我, 運行 ethtool -S 會有幫助, 但是我的 ethtool 沒有 -S 選項。

怎麼知道為什麼資料包被丟棄

通過穀歌搜索, 發現一個很酷的工具叫 dropwatch 。 沒有現成的 Ubuntu 安裝套裝軟體, 但可以通過 github 下載:

https//github.com/pavel-odintsov/drop_watch

以下是我可以編譯的說明:

sudo apt-get install -y libnl-3-dev libnl-genl-3-dev binutils-dev libreadline6-dev git clone https://github.com/pavel-odintsov/drop_watch cd drop_watch/src vim Makefile # comment out the -Werror argument to gcc make

這裡是輸出! 它告訴我哪個內核函數丟失資料包, 酷!

sudo ./dropwatch -l kas Initalizing kallsyms db dropwatch> start Enabling monitoring... Kernel monitoring activated. Issue Ctrl-C to stop monitoring 1 drops at tcp_v4_do_rcv+cd (0xffffffff81799bad) 10 drops at tcp_v4_rcv+80 (0xffffffff8179a620) 1 drops at sk_stream_kill_queues+57 (0xffffffff81729ca7) 4 drops at unix_release_sock+20e (0xffffffff817dc94e) 1 drops at igmp_rcv+e1 (0xffffffff817b4c41) 1 drops at igmp_rcv+e1 (0xffffffff817b4c41)

用perf監控丟棄的資料包

還有另一個很酷的方法, 用來調試發生什麼。

thomas graf 告訴我, 可以使用 perf 監視 kfree_skb 事件, 這將告訴你什麼時候丟棄資料包(內核堆疊發生的地方):

sudo perf record -g -a -e skb:kfree_skb sudo perf script
同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示