要快速判断台湾 CN2 线路是否有问题,首选使用 ping 和 traceroute 作为初筛工具。通过 ping 可以获取往返时延(RTT)与丢包率,若出现波动或超时说明链路可能不稳定;通过 traceroute(或 Windows 下的 tracert)可以定位是哪一跳开始出现明显的延迟上升或丢包。
示例命令:
Linux/ macOS: ping -c 10 目标IP
traceroute: traceroute 目标IP
Windows: ping -n 10 目标IP / tracert 目标IP
若 ping 的 RTT 稳定且丢包为 0,通常说明网络链路健康;若 traceroute 在某一跳 RTT 突增且之后无回复,可能是该跃点对 ICMP 限制或真实链路瓶颈,需要结合其它工具进一步排查。
当 traceroute 指示某一跳延迟升高时,建议使用 mtr 进行持续性测量与统计。mtr 结合了 ping 与 traceroute 的功能,可以实时展示各跳的延迟、丢包和稳定性,便于判断是瞬时波动还是持续性丢包。
示例命令:
mtr -rw 目标IP (-r 生成报告,-w 宽格式)
mtr 输出中如果某跳出现高丢包率且下一跳丢包率同样高,说明问题可能出在该跳或其上游;如果下一跳丢包恢复或降为 0,可能是该设备对 ICMP 做了策略限制,不一定影响 TCP/UDP 业务。
可使用 tcptraceroute 或在 mtr 中使用 TCP 模式(mtr -T),模拟业务端口的探测,从而判断是否为 ICMP 被限制造成的误判。
iperf 是评估链路带宽、抖动(jitter)与丢包率的常用工具。通过在两端部署 iperf3 服务端与客户端,可以在 TCP/UDP 模式下测出实际可用带宽与抖动情况,特别适合判断业务层(TCP/UDP)是否受线路影响。
示例命令:
服务端:iperf3 -s
客户端(TCP):iperf3 -c 服务端IP -P 4
客户端(UDP):iperf3 -c 服务端IP -u -b 100M
UDP 测试会显示抖动和丢包率,若 UDP 丢包或抖动高,说明线路或设备在高带宽下不稳定;若 TCP 吞吐受限且延迟高,可能存在丢包重传或拥塞。
进行 iperf 测试时应避开高峰时段或与业务隔离的测试服务器,以免影响正常业务。若是跨运营商或跨国测试,需考虑中间网络路径的策略差异。
当需要深入分析报文层的丢包、重传、RST 或延迟原因时,使用 tcpdump 在服务器侧抓取数据包并在本地用 Wireshark 分析是常见做法。抓包时建议按端口或协议过滤,避免产生过大的抓包文件。
示例命令:
tcpdump -i eth0 host 目标IP and port 目标端口 -w capture.pcap
在 Wireshark 中查看 TCP 流的重传、窗口缩小、三次握手延迟、以及 TCP Options 等信息;利用 IO 图和 Round Trip Time 统计可以判断业务层感知的延迟与丢包引发的性能问题。
- 查找重复 ACK、SYN/ACK 丢失或长时间未收到 ACK 的情况;
- 关注 ICMP Destination Unreachable、TONs 或 Path MTU 相关问题;
- 对 UDP 业务关注丢包与抖动分布,结合 iperf 的 UDP 报告交叉验证。
在高速链路抓包建议使用硬件采样或在边缘做镜像,避免丢包导致捕获不全。同时记录抓包时间范围与业务日志,便于 correlate(关联分析)。
长期监控与 SLA 验证需要使用专业监控平台或第三方测站。常见方案包括:BGPlay/Looking Glass(运营商提供),RIPE Atlas、ThousandEyes、Datadog Network Monitoring、Zabbix + 自建探针等。这些工具可以提供持续的 latency、packet loss、route changes、BGP 路由波动等历史数据与报警。
使用建议:
- RIPE Atlas 可在不同地理位置主动测量到指定目标的 RTT 与 traceroute;
- ThousandEyes 提供网页性能、DNS、BGP 与主干链路可视化,便于定位跨 ASN 的问题;
- 自建探针(Zabbix/Prometheus + blackbox_exporter)适合对内部链路与业务端点做 SLA 级别监控与告警。
当确认为 CN2 线路问题需向运营商提交工单时,建议准备:持续的 mtr 或 traceroute 报表、iperf 测试记录(TCP/UDP)、抓包 pcap、以及第三方测站的历史图表。这些证据有助于快速定位问题是否在运营商链路或上游。
