1.
快速判断问题类型:先区分是DNS解析还是路由/链路问题
- 使用5条快速命令判断:ping -c 4 域名、ping -c 4 IP、dig +short 域名、traceroute -n IP、mtr -r -c 10 IP。
- 如果域名无法解析(dig无A记录),优先处理DNS;如果域名能解析但ping不到IP,优先做路由/链路排查。
- 常见误判:域名有CNAME指向CDN但CDN配置错误会表现为“解析正常但访问异常”。
- 建议同时在公网和内网两个环境执行以上命令,排除本地DNS缓存与防火墙影响。
- 示例:dig 输出示例:;; ANSWER SECTION: hk-cn2.example.com. 300 IN A 45.77.60.10,表示解析正常但后续需查看连通性。
2.
DNS详细检查步骤:从客户端到权威逐级验证
- 命令:dig @8.8.8.8 hk-cn2.example.com A +trace,用于追踪从根到权威的解析路径。
- 检查TTL与A记录:确认A记录与预期IP一致,TTL是否被CDN/托管商强制覆盖(常见TTL=60、300)。
- 对比不同DNS服务器解析结果:8.8.8.8、1.1.1.1、本地ISP DNS,确认是否存在污染或劫持。
- 如果使用DNS解析到负载均衡或CDN,检查对应CNAME链是否指向正确的供应商域名。
- 示例dig输出(模拟):;; Query time: 28 msec\n;; ANSWER SECTION:\nhk-cn2.example.com. 300 IN A 203.208.40.10。
3.
路由与链路排查:traceroute、mtr与BGP信息的联合分析
- traceroute -n 45.77.60.10 查看每跳延时与丢包,注意第一处明显丢包即可判断链路问题。
- mtr -r -c 20 45.77.60.10 给出稳定的往返延时与丢包统计,比单次traceroute更可靠。
- 查询AS与BGP:whois 45.77.60.10 或使用 https://bgp.he.net/ip/45.77.60.10 检查是否属CN2相关ASN(如AS9808/AS4837等)。
- 如果某一跳在中国骨干网(如219.158.x.x、202.97.x.x)出现100%丢包,可能是ISP链路或防火墙策略导致。
- 案例分析:真实案例中,traceroute显示第6跳到中国联通回传丢包,从而确认为上游ISP故障并联系了带宽提供商。
4.
端口与应用层连通性检测:TCP握手与服务可用性验证
- 使用tcping或telnet测试端口:tcping -t 3 203.208.40.10 22 或 telnet 203.208.40.10 80。
- curl -I --connect-timeout 5 http://hk-cn2.example.com 用于检测HTTP头与重定向,判断是否是应用层超时。
- 对比端口层与ICMP层:有时ICMP被限速但TCP可通,或反之;因此两个都要测。
- 在服务端检查防火墙(iptables/nftables)与服务监听:ss -ltnp | grep :22 或 netstat -plant。
- 案例:某VPS上iptables默认拒绝ICMP,导致用户以为网络不可达,实际SSH可连,调整规则后恢复正常。
5.
DNS缓存、CDN与TTL策略的快速修复方法
- 临时修复:使用临时A记录指向备用IP并降低TTL到60以内,加速生效;操作后通知用户清除本地DNS缓存(Windows ipconfig /flushdns)。
- 如果使用CDN,检查回源是否健康,是否存在回源IP限速或DDoS触发策略导致回源不可达。
- 若为DNS劫持或污染,建议将域名解析到海外备用IP并通过CDN或TCP中继恢复访问。
- 长期策略:为关键站点配置多个DNS提供商(主/备),并设置合理TTL与监控告警。
- 案例:某客户将TTL从3600降为60并添加备用A记录,15分钟内大部分用户恢复访问。
6.
真实案例与参考服务器配置:如何依据配置快速定位问题
- 真实案例简述:客户“A”
香港CN2 VPS(IP 203.208.40.10)在某日被上游路由策略错误影响,表现为traceroute在第5跳完全丢包,但SSH端口在部分地区可通。运维通过更换出口ASN并联系带宽商恢复。
- 推荐参考配置表(示例):
| 主机名 | IP | 线路类型 | ASN | CPU/RAM | OS |
| hk-cn2-01 | 203.208.40.10 | CN2 GIA | AS9808 | 4vCPU / 8GB | Ubuntu 20.04 |
| hk-cn2-02 | 45.77.60.10 | 普通国际链路 | AS20473 | 2vCPU / 4GB | CentOS 7 |
- 运维操作建议:保留完整的排障日志(traceroute、mtr、dig输出),并记录时间点以便与骨干运营商沟通。
- DDoS防御提示:若怀疑是攻击导致连通问题,先在边缘或CDN开启高防,收集流量包头(pcap)并与清洗服务配合。
- 总结:排查顺序建议为:DNS核验 → IP连通(ICMP/TCP)→ 路由跟踪(mtr/traceroute)→ BGP/ASN核查 → 与带宽商或CDN沟通解决。
来源:香港cn2线路服务器打不开时DNS和路由检查的实用操作手册