1. 基本信息登记与变更记录核对
- 核对迁移前后域名解析记录(A/AAAA/CNAME)是否与变更单一致,记录变更时间与操作人员。
- 确认阿里云CDN控制台中的加速域名列表包含迁移域名,状态为已部署。
- 检查源站地址是否正确填写(IP或源站域名),避免错误指向旧服务器。
- 记录DNS TTL值:建议临时降为300秒以便回滚和验证,迁移完成再恢复为3600或更高。
- 保留变更快照与操作日志备查,有助于回归问题定位与审计。
2. SSL/TLS证书与HTTPS回源验证
- 确认阿里云CDN是否托管证书或使用自有证书,检查证书到期时间。
- 使用 openssl s_client -connect example.com:443 查看证书链与协议版本(示例:TLSv1.2/1.3 支持)并记录。
- 验证HTTPS回源设置(回源协议)为https时,源站必须配置有效证书或选择忽略证书校验(不推荐)。
- 验证HSTS与OCSP Stapling是否按策略开启,避免浏览器二次请求延时。
- 测试证书在不同地区访问的表现,确保CDN节点与浏览器兼容性。
3. 缓存策略与静态资源回收验证
- 检查响应头 Cache-Control 与 Expires 是否符合预期,示例:静态资源 Cache-Control: max-age=604800。
- 验证阿里云CDN端的缓存规则是否覆盖特定路径(如 /static/、/images/)。
- 执行CDN刷新/预热流程:批量刷新路径并统计完成时间,记录刷新速率与失败率。
- 用 curl -I https://example.com/resource.jpg 比对 Edge 与回源的缓存命中(X-Cache 或 X-Cache-Status)。
- 对常更新资源设定版本号(query string或路径),并监测缓存回归是否能立即生效。
4. 回源健康检查与负载均衡验证
- 在阿里云控制台设置回源探测(健康检查)参数:间隔10s,超时5s,失败阈值3次为例。
- 验证回源切换/熔断逻辑:模拟源站宕机,观察CDN是否回退到备用源或返回错误页面。
- 检查回源带宽与并发限制,确认不会在回源高并发时触发QPS限制。
- 使用负载均衡策略(轮询/权重)并记录各源站的命中率与响应时间。
- 记录回源HTTP状态分布(2xx/3xx/4xx/5xx)以便回归分析。
5. 性能基线测量与地域回归测试
- 建立迁移前后性能基线:重要指标包括TTFB、首字节时间、页面完全加载时间。
- 使用阿里云全球测速或第三方工具(WebPageTest)从多地区采集延迟数据并比较。
- 针对重点区域做并发压测(示例:100并发、持续60s),记录错误率与响应时间。
- 收集并比较DNS解析时间,确保解析由阿里云DNS或权威DNS生效。
- 把性能数据写入报告表格,便于回归比较与KPI确认。
6. 防护策略与DDoS防御验证
- 确认阿里云DDoS基础防护与高级防护是否开启,记录防护等级与白名单配置。
- 验证WAF规则与访问控制列表(ACL),模拟常见攻击(XSS/SQLi)并确认被拦截。
- 设置速率限制与CC防护阈值(示例:同一IP 100 requests/min),观察是否触发并记录封禁事件。
- 在流量激增时监控异常流量来源并分析回源负载变化。
- 保留安全事件日志以便回归时追溯攻击时间与触发规则。
7. 日志、监控与告警配置核对
- 打开阿里云CDN日志服务(日志投递到OSS或SLS),确认日志格式与字段完整。
- 配置关键指标告警:回源异常率、5xx比率、带宽利用、缓存命中率等阈值。
- 验证告警渠道(邮件/SMS/钉钉)是否正常触达并记录告警响应时间。
- 建立自动化回归脚本,定时抓取关键URL并比对返回状态与性能指标。
- 做一次完整的故障演练并记录各项响应与修复步骤。
8. 真实案例与配置示例
- 案例:某电商迁移至新VPS后,首次发现某静态资源缓存未命中,原因是源站返回 Cache-Control: no-cache。调整后命中率从 24% 提升至 92%。
- 源站配置示例:4 vCPU,8 GB RAM,带宽 100 Mbps,带宽峰值测试 850 Mbps(短时突发由云厂商弹性带宽处理)。
- 回源健康检查配置:探测路径 /health,返回 200 为健康;间隔 10s,超时 5s,失败阈值 3。
- DDoS 策略示例:基础防护+清洗阈值 1 Gbps,CC 防护阈值 2000 req/s,速率限制单IP 100 req/min。
- 迁移后对比数据表(示例)如下:
9. 迁移后关键数据对比(示例表)
| 指标 | 迁移前 | 迁移后(优化后) |
| 缓存命中率 | 24% | 92% |
| 平均TTFB(ms) | 450 | 120 |
| 峰值带宽(Mbps) | 540 | 850 |
| 回源错误率(5xx) | 3.2% | 0.4% |
| DNS解析平均时间(ms) | 80 | 28 |
10. 总结与回归流程建议
- 制定灰度迁移策略,先小范围切换到阿里云CDN并监控关键指标 24-72 小时。
- 准备回滚方案与低TTL窗口(例如300秒)以便快速回退。
- 对发现的问题做Root Cause Analysis并形成知识库,避免重复故障。
- 定期复测缓存、证书和防护策略,尤其在大促或流量剧增前。
- 将检测清单自动化(脚本化),做到迁移后能在15分钟内完成全链路回归验证。