今年新上了一批机器用的是bcm 5709的网卡,由于使用的OS版本比较老,带的驱动bug比较多造成线上问题频繁。检查了一下# lspci | grep -i Ethernet03:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)03:00.1 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)04:00.0 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)04:00.1 Ethernet controller: Broadcom Corporation NetXtreme II BCM5709 Gigabit Ethernet (rev 20)

ethtool -G eth0 rx 1020

修改配置# ethtool -g eth0Ring parameters for eth0:Pre-
set maximums:RX:          1020RX Mini:     0RX Jumbo:     4080TX:          255Current hardware settings:RX:          1020RX Mini:     0RX Jumbo:     0TX:          255

但是这样修改后发现并没有缓解,后来继续搜了一下,发现是固件的bug。后来把RHEL的内核更新到最新版,问题得到了修复。

固件的bugPS:其实我一直不喜欢抱死在一个老树上,有bug的东西该升级就升级,不会做无效的推脱。现在线上有的机器就是一周挂几次,负责的人每天都说在排查。但是实际上又不做任何行动。