某台华为服务器上的万兆网卡 eno5 出现网络不稳定、连接中断、丢包率极高的现象。通过 ping 测试发现延迟剧烈波动,部分请求超时;业务服务偶发不可用。
1. 查看内核日志
dmesg | grep -i ixgbe输出关键信息:

ixgbe 0000:af:00.0 eno5: NIC Link is Down
ixgbe 0000:af:00.0 eno5: NIC Link is Up 10 Gbps, Flow Control: RX/TX日志显示:网卡物理链路在数秒内反复“Up/Down”切换,即典型的 Link Flapping(链路震荡)。
注意:这不是软件配置问题,而是物理层通信异常!
2. 排除干扰项
日志中出现的
docker0、veth、AppArmor DENIED等信息属于正常系统行为,与网络中断无关。驱动
ixgbe已正确加载,说明不是驱动缺失问题。3. 定位硬件型号
通过
lspci确认该网卡为:Intel Corporation 82599ES 10-Gigabit SFI/SFP+ Network Connection
属于经典 10G 光口网卡,依赖 SFP+ 光模块工作。
根本原因插入了不被支持或故障的 SFP+ 光模块!
Intel 82599 系列网卡对光模块兼容性要求较高。当检测到以下情况时,会主动拒绝初始化端口,甚至在运行中断开链路:
使用非原厂 / 第三方不兼容模块;
模块老化、损坏或接触不良;
光纤弯折、污染或未插紧;
对端交换机端口异常。
这直接导致内核反复报告 “Link is Down → Up”,造成网络闪断和高丢包。
解决方案
更换 SFP+ 光模块
拔下当前模块,替换为已知兼容且完好的模块(建议原厂或认证兼容型号)。
检查光纤连接
确保光纤无明显弯折(弯曲半径 ≥ 10cm);
清洁光模块端面;
重新插拔两端接口。
验证对端交换机
登录交换机,确认对应端口无 error、flap 报警;
确保速率/双工模式匹配(通常设为 Auto)。
#重启网卡(可选)
ip link set eno5 down && ip link set eno5 up更换模块后,dmesg 不再出现频繁 Up/Down,ping 测试稳定,问题解决。
经验总结
常用排查命令
# 查看网卡驱动和型号
lspci -k | grep -A 3 -i ethernet
# 实时监控链路状态
dmesg -w | grep -i "link"
# 查看网卡错误统计
ethtool -S eno5 | grep -E "(err|drop|over)"
# 测试连通性与丢包
ping -c 100 8.8.8.8