1.
站群与负载均衡概述
使用负载均衡的目的:提高可用性与扩展性,均衡流量压力。
适用场景:多域名、多站点同机房或跨机房的流量分发。
常见技术栈:DNS轮询、反向代理(Nginx/HAProxy)、四层LVS+Keepalived。
性能预估:单台普通香港VPS(4vCPU/8GB/1Gbps)峰值处理约3k RPS静态内容。
指标关注:QPS/RPS、平均响应时间(P95)、连接数、带宽利用率。
与CDN配合:将静态资源交给CDN,Origin仅处理动态请求并配合负载均衡。
2.
分层设计:外层使用CDN或云WAF+LB,内层部署反向代理集群或四层负载均衡。
节点分布:建议至少3台应用服务器+2台备用负载均衡器(主备)。
故障切换:使用keepalived实现VRRP虚拟IP做自动漂移,切换时间目标 <5 秒。
健康检查:后端健康检查周期建议10s,连续失败3次判定下线。
会话一致性:必要时使用sticky session或把会话存储到Redis共享。
监控告警:Prometheus+Grafana监控RPS/CPU/conn数,告警阈值如CPU>80%持续5分钟触发扩容。
3.
常见负载均衡实现方式与配置示例
方法一:DNS轮询,简单但无法感知节点健康,适合读流量。
方法二:Nginx作为七层反向代理,使用upstream和weight,支持漏斗式流量控制。
方法三:HAProxy做七层或四层负载均衡,支持leastconn、rate limiting、stick tables。
方法四:LVS+Keepalived做四层高性能转发,适合大并发纯TCP或UDP场景。
示例(HAProxy 简化片段):
global
maxconn 20000
defaults
mode http
timeout connect 5s
timeout client 30s
frontend www_front
bind 203.0.113.10:80
default_backend web_back
backend web_back
balance leastconn
server hk01 10.0.0.11:80 weight 100 check
server hk02 10.0.0.12:80 weight 100 check
server hk03 10.0.0.13:80 weight 80 check
会话粘滞可用cookie或stick-table实现,健康检查使用HTTP GET /healthz返回200。
4.
服务器配置与数据示例(表格演示)
下面为一个香港站群实例的配置列表与实时负载示例:
| 节点 | 私有IP | 规格 | 带宽 | Weight | CPU% | RPS |
| hk-app-01 | 10.0.0.11 | 4vCPU / 8GB / 100GB SSD | 1Gbps | 100 | 35% | 1200 |
| hk-app-02 | 10.0.0.12 | 4vCPU / 8GB / 100GB SSD | 1Gbps | 100 | 32% | 1150 |
| hk-app-03 | 10.0.0.13 | 2vCPU / 4GB / 50GB SSD | 500Mbps | 80 | 48% | 680 |
| hk-lb-01 | 203.0.113.10 | 2vCPU / 4GB / 50GB SSD | 1Gbps | - | 12% | --- |
注意:以上数据为运维观测样本,RPS为响应请求数,CPU为平均利用率,带宽为单机承载上限。
5.
CDN与DDoS防御实操要点
优先接入CDN:静态资源全部走CDN(阿里云CDN/Cloudflare),减少Origin带宽峰值。
WAF和频控:开启WAF防注入/恶意请求规则,配置单IP并发连接数上限为500。
抗DDoS策略:接入清洗中心或云防护,常见防护容量10Gbps/100Gbps可选,按业务峰值选择。
黑白名单与速率限制:对登录/接口设置200次/分钟的速率阈值和异常封禁策略。
流量分发策略:高峰使用权重调度,低性能节点自动降权或下线,阈值如响应时间>500ms连续3次下线。
实测数据:某次攻击峰值流量80Gbps,CDN+云清洗后到达Origin流量降至2Gbps以内,业务可持续运行。
6.
真实案例与运维流程(落地手册)
案例背景:电商客户在香港部署站群,6个站点共享3台应用服务器与2台HAProxy负载器。
流量情况:日均访问250k UV,峰值并发6k RPS,峰值带宽约3.5Gbps。
解决方案:前端接入全球CDN+云WAF,内部使用HAProxy + keepalived做主备虚拟IP切换。
部署步骤:1) 配置keepalived VRRP,2) 部署HAProxy并导入后端server列表,3) 配置健康检查与自动下线,4) CDN回源配置和WAF规则同步。
运维脚本与检查点:查看keepalived状态 ip addr show、haproxy stats页面监控、prometheus告警(cpu>85%/rps>5k)。
恢复演练:定期(每月)做一次主LB切换演练,目标切换无感知时间 <5 秒,记录并优化发现的瓶颈。
来源:运维手册 香港站群服务器怎么使用负载均衡设置方法