最近不少同行在部署阿里云安全加速SCDN的Edge节点时踩了坑,特别是配置环节和错误排查这块儿。结合我自己趟过的雷,整理了一份硬核操作手册,专治各种部署疑难杂症。
部署前的关键准备工作
别急着点创建按钮,先把地基打牢。源站信息必须100%准确,IP或域名错一个字符,后面全白干。提前在服务器防火墙放行阿里云的回源IP段,这个列表在控制台能查到最新版,漏了这条直接502。HTTPS证书建议提前上传到SSL证书服务,避免部署中途卡在证书验证环节。
SCDN Edge节点标准部署流程
进控制台找到SCDN服务,新建加速域名。重点来了:业务类型选"安全加速",普通CDN和SCDN的节点调度策略完全不同。回源协议根据源站支持情况选HTTP/HTTPS,混合协议会触发301重定向循环。
缓存配置是性能命门。静态资源像JS/CSS建议设2592000秒(30天),动态路径如/api/*必须设0秒缓存。有个隐藏技巧:开启智能压缩能省30%以上带宽,但记得检查源站是否已开启gzip,双重压缩会乱码。
必会的节点调优技巧
默认配置够用但不够快。在性能优化页:开启TCP BBR拥塞控制算法,比默认的cubic提升高并发传输效率。边缘脚本(EdgeScript)是神器,三行代码实现AB测试:
if eq(${arg_group}, "test") { setbackendhost("new.example.com"); }
实时生效不用重启节点。
高频错误代码实战处理方案
403 Forbidden
九成是访问控制没设对。检查是否误开了Referer防盗链却漏加白名单,或IP黑名单误封了真实用户。紧急处理:在SCDN控制台-安全配置里关掉防盗链,日志里搜"deny by referer"确认。
502 Bad Gateway
先看源站是否存活,在节点机器上curl源站IP。大概率是回源Host头错误,SCDN默认用加速域名回源,如果源站做了域名绑定,必须在回源配置里改写Host为源站域名。用tcpdump抓包验证:tcpdump -i eth0 host 源站IP -w /tmp/debug.pcap
503 Service Unavailable
检查QPS超限。免费版默认2000QPS,突发流量会熔断。升级到企业版或调整限流阈值。还有个隐藏坑:后端服务器TIMEWAIT连接数爆满,netstat -ant | grep TIMEWAIT | wc -l 超1万就得调内核参数:
sysctl -w net.ipv4.tcptwreuse=1 sysctl -w net.ipv4.tcpmaxtwbuckets=20000
SSL Handshake Failed (ERRSSLVERSIONORCIPHERMISMATCH)
证书链不完整最常见。用openssl检查:openssl sclient -connect 域名:443 -showcerts 必须看到3段证书(域名证书、中间CA、根CA)。如果用了ECC证书,确保节点支持TLSECDHEECDSA*套件,老系统可能只认RSA。
安全防护配置要点
WAF规则别直接开阻断模式,先设观察期。误杀日志在SCDN日志服务的"blockaction"字段里。CC防护的自定义频率阈值要结合业务,API接口建议设单IP 50次/秒,静态资源可放宽到300次。遇到误封用API秒解封:
aliyun scdn AddScdnDomain --DomainName 域名 --SecurityToken "{\"Type\":\"unblockip\",\"Ips\":\"1.2.3.4\"}"
部署后的效果验证方法
用curl命令三重验证: curl -I http://域名 -x 节点IP:80 看X-Cache字段是否HIT curl -k https://域名 --resolve 域名:443:节点IP 测HTTPS握手 mtr -rw 域名 追踪最终落地节点 真实用户访问日志在SLS里,重点看scdnaccesslog的request_time字段,超过500ms就得优化。
这套组合拳打下来,基本能搞定95%的SCDN节点部署问题。碰到玄学故障,记得抓包存证再提工单,阿里云工程师看到tcpdump文件响应速度能快三倍。现在可以开始部署你的边缘节点了。