CDN常见故障.

访问564

问题描述:资源接入cdn之后,出现少量564情况
Headers页面显示Status Code:564

#问题排查思路&信息收集
获取用户测试URL;然后通过qget和yy的日志分析工具进行分析。

#解决方法
1. 优化源站的响应时间,cdn的默认超时时间是10s,超过10s则cdn会返回564
2. 如果是大客户,可以提需求单调整默认超时时间,建议不超过60s。

源站带宽问题

问题描述:源站为腾讯云cvm,接入cdn之后很慢

问题排查思路&信息收集
获取客户测试url
admin.上查看源站地址:admin.cdn.oa.com
通过qget和yy的日志分析工具进行分析
使用curl复现客户问题
使用tss综合信息工具分析源站源站情况
http://tss.sng.com/tool/platform/index?smenu_id=28

解决办法
优化源站性能,提高源站带宽,源站为cvm时候,可拆单给转单给基础队列跟进

使用cdn之后WordPress登录问题

问题描述:使用cdn之后用户退出后重新登录在线状态问题
http://tss.sng.com/ticket/page/detail?id=2028814

问题排查思路&信息收集
获取客户测试url
使用chrome浏览器等f12功能
在admin.上查询配置信息:admin.cdn.oa.com
通过qget和yy的日志分析工具进行分析
登录状态异常问题,可以从缓存过期配置设置异常导致

解决办法
修改缓存过期配置为0,本案例中,登录均在首页所以首页设置为0
登录:https:/console.cloud.tencent.com/cdn/refresh.刷新相关目录的缓存

源站信息配置问题

问题描述:客户配置源站信息为域名时候,访问出现报错
http://tss.sng.com/ticket/page/detail?id=2141992
问题排查思路&信息收集
在admin.上查询配置信息:admin.cdn.oa.com点击buid查看源站配置的upstream_domain和fwd_host字段
获取客户测试urL,使用curl直接绕过cdn进行测试

#### 解决方法

源站信息为域名的情况下
如果源站信息是用于解析,则回源host和加速域名是一个域名
如果源站信息是用于访问,则回源host和源站信息域名是一个域名
本工单客户修改回源host与源站信息一致之后,恢复正常

开启range回源导致访问异常

客户反馈接入cdn之后访问异常
http://tss.sng.com/ticket/page/detail?id=2113718
问题排查思路&信息收集
获取客户测试url,使用curl进行源站测试
使用chrome浏览器等f12功能

解决方法
客户在工单中提到了很多信息,如缓存过期配置等,但是核实配置没有出现异常的时候,需要从状态码上排查
访问css文件出现502,cdn是不会返回502的,也就是说cdn回源的时候出现异常。注意到cdn开启了rangel回源故测试源站是否支持range

开源Range回源导致访问异常解决方法
经测试不支持,关闭range之后恢复正常

源站异常导致cdn异常

问题描述:首页访问正常,但是节点显示异常
http://tss.sng.com/ticket/page/detail?id=2008725
问题排查思路&信息收集
Dig域名
在admin.上查询配置信息:admin.cdn.oa.com
通过qget和yy的日志分析工具进行分析,使用curl进行测试

解决方案
确定源站有问题后,客户修复源站后恢复
一般情况下,客户描述的问题,和问题的原因是完全两个方向的。
需要,所以排查需要细心,不能经验主义。

请求命中率数值低

问题描述:客户根据控制台统计,请求命中数很低
http://tss.sng.com/ticket/page/detail?id=1956337
从原理上我们总结为以下几点造成
缓存配置问题,如缓存时间较短。
HTTP Header导致无法缓存,请检查源站Cache-Control或Expires的设置。
源站类型问题,可缓存的内容少。
网站访问量低,过期时间短,命中的文件少,导致频繁回源。
从计算方法上通过关闭range回源的方式,也可以提高请求命中率
请求数命中率:百分比,命中率 = (请求数量-回源请求数量)/请求数量。

CDN域名+端口进行访问异常

问题描述:客户加速域名使用自定义端口,访问出现异常
http://tss.sng.com/ticket/page/detail?id=2005263

解决方案
CDN节点只支持80, 8080, 443三个端口,其他端口都不支持
CDN回源的时候不限制源站的端口

域名接入CDN之后访问出现514

问题描述:域名接入cd之后出现514状态码,是部分出现异常,
部分资源显示正常
http://tss.sng.com/ticket/page/detail?id=2004797
问题排查思路&信息收集
咨询客户测试场景之后,在本地使用浏览器的12进行测试复现,一般情况下不是源站有特殊配置,导致这个状态码都是由于cdn设置了ip限频导致的
Failed to load resource:the server responded with a status of 514 ()
解决方法
关闭cdn的ip限频,或者把这个配置次数上调

参数过滤配置问题

问题描述:客户访问所有图片都是一样
http://tss.sng.com/ticket/page/detail?id=2000415
问题排查思路&信息收集
跟客户确认问题故障url,查看url规则
如果图片是由文件加载,那么就通过浏览器f12查看文件加载的url
解决方法
关于这类工单,只要对比资源ul可以发现,客户的资源是根据?后面的参数来决定的,只需要把参数过滤关掉就可以了

源站配置了http跳转https问题

问题描述:网站不能打开,有多次重定向等报错
http://tss.sng.com/ticket/page/detail?id=2112631
问题排查思路&信息收集
需要梳理源站和cdn的重定向配置逻辑
该工单的客户配置了nttps,源站做了http转https.重定向,而cdn上也做http转https:重定向,而回源方式是http回源
解决方法
修改回源方式为协议跟随或者源站去掉http转https重定向

访问423+重定向问题

问题描述:域名接入cdn之后,出现423 locked报错
http://tss.sng.com/ticket/page/detail?id=2151652
排查思路
1.三板斧定位
2.确定域名接入cdn之后,对配置进行检查,产生423一般是由于在cdn节点之间多次重定向导致的
3.客户的源站开启了http跳转https,cdn也开启了http转https,回源为http方式,还开启了重定向跟随功能,导致跳转起环
解决方法
修改回源方式为协议跟随,关闭重定向跟随后解决

CDN+cos组合访问cdn域名401问题

问题描述:客户访问cos的加速域名(自定义域名)出现401
http://tss.sng.com/ticket/page/detail?id=2121604

问题排查思路&信息收集
401是鉴权错误的意思,联想到c0s对资源有各种访问控制,需要通过鉴权实现,需要具体分析c0S的配置才可以制定解决方案
导致这种情况有两种可能:
1,bucket为私有读写,访问需要带签名
2,v4和v5控制台的acl不一致
此工单符合第二种情况

解决方案
1.在COS控制台将oucket的权限改为公有读写,保存,然后再改回公有读私有写,保。
2.在CDN控制台将此域名下线,删除。
3.在COS控制台重新开启CDN加速。

CDN响应533

问题描述:域名无法访问,出现533报错
http://tss.sng.com/ticket/page/detail?id=2148824

问题排查思路&信息收集
先使用三板斧确认域名是否在腾讯云cdn上加速
一般情况下533是由于源站无响应导致的,可以引导客户检查是否开启了ip访问白名单
此工单中客户的acL做了限制,需要对cdn的回源请求ip做放通操作

解决方法
如果客户为sp平台用户,则提供中间源p地址段给客户,如果客户为s1平台的用户,需联系售后owner进一步了解提供解决方案

Referer配置问题

问题描述:客户refereri配置异常,导致访问出现403
http://tss.sng.com/ticket/page/detail?id=2128390

问题排查思路&信息收集
1.使用三板斧确定业务
2.然后使用curl命令和浏览器复现客户的问题,此工单是由于客户的测试方法有误,
使用空referer:请求访问已配置防盗链的资源,导致403

解决方法
复现客户的问题后,告知客户测试方法
类似的工单均可以以此工单的测试方法解决

Referer配置问题

问题描述:客户referer配置异常,导致访问出现403
http://tss.sng.com/ticket/page/detail?id=2128390

问题排查思路&信息收集
1.使用三板斧确定业务
2.然后使用cul命令和浏览器复现客户的问题,此工单是由于客户的测试方法有误,使用空referer?请求访问已配置防盗链的资源,导致403

解决方法
复现客户的问题后,告知客户测试方法
类似的工单均可以以此工单的测试方法解决

自动诊断节点获取失败

问题描述:客户发现自助诊断显示域名异常
http://tss.sng.com/ticket/page/detail?id=2057285

问题排查思路&信息收集
自助诊断信息异常,主要原因是客户本地网络有问题,导致诊断页面无法获取客户本地解析正确的地址,但是页面可以根据客户的访问ip获取最优节点ip,需要客户在本地进行解析测试

解决方法
引导客户手动进行dig nslookup等解析操作,比对页面提供的最优节点是否一致