dns解析超时的排查

这几天有开发同学反馈说是线上的应用dns解析总是失败,我自己测试了连续dig 1000次都是正常的。今天也把合作方的同学一起叫上了。因为之前是看对方有的CNAME设置的TTL是0,造成每次需要重新解析,dns服务器没有办法做cache。

今天排除了很久,后来看了线上的日志才发现问题的本质是业务量非常小,每天就几十笔调用,即便对方把TTL改成60后,实际每次应用服务器查询dns的时候,dns服务器都是需要重新递归一次(每次两三秒),所有可能没有解析出来应用都已经报错了。

这个也没有啥好的解决的方式,要么应用把这个超时时间增大,要么自己另外跑个脚本周期性地访问dns缓存住这样的域名。

此条目发表在dns分类目录。将固定链接加入收藏夹。